Gene Hlac_0902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0902
Symbol
ID	7401273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	892898
End bp	894379
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	71%
IMG OID	643707967
Product	hypothetical protein
Protein accession	YP_002565570
Protein GI	222479333
COG category	[S] Function unknown
COG ID	[COG1650] Uncharacterized protein conserved in archaea
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.757817
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.396557
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATAGCGA TCGTCGTCAG CCGGGCCGAC AGCGCCTCGG AACACATCGG CGAGCACCTG 
CTCGACCTCG GCGACTGGGA GCGCCGCGAC GACCCGAGTC GTCCCGACGC CGACGGCGGC 
GGAACGTACT ACCGGACCGA CGGGTTCGAG CTGCGGGAGT TCGACGACCT CCACATCTAC 
CTGGACGATC CCGCGGCCGC GTTCGGTGGT GGGGCAGGTG ACGAGACGAA CGACGCGGCA 
AGCGACGACA CCGACGAGAC CCCCGAGTTC CTCGCGTTCG TCTCCCGCCA TTCCGGCGAG 
ACGGGAGAGC TACTAACGGC TCACGTCACC GGGAACTTCG GCCCTGCGCC ATACGGGGGC 
GAGCCGGACA CGCTGGCTCG GGCGGCGCCG GGAGCCGAGA AGCGCGTCGT CGAGGCGCTG 
GCGGCGCACG CTCCCGAGGG GTACGACGTG GGGATCGAGT GCACTCACCA CGGCCCGACG 
GACACGTCCG TCCCGTCGCT GTTCGTCGAA CTCGGCTCCG ACGAGCCGCA GTGGACCGAC 
GCGGATGCGG CCCGGGCGGT CGCGCGGGCG GTGCTCGACC TGCGCGGGAC CGACGCGGAT 
CTGGTCACTG ACGCAGGGGA AACGACTGAC GAGATCGACG ACGACCCCCA CCCCCGCCAC 
GTCGTCGGCT TTGGCGGCGG CCACTACGCC CCGCGGTTCA CCCGAATTGT CCGCGAGACC 
GAGTGGGCGG TGGGACACGT CGGCGCCGAC TGGGCGCTCG GAGAACTTGG CGCGCCCGAC 
GCGAACCGAG ACGTGATCGA GCAGGCGTTC GCGCGGAGCA AGGCGAATGT GGCGGTTATC 
GAGGGTGAAA AGCCCGATCT CGAAGCGACG GTCGAGGCGC TCGGCCACCG TGTCGTGAGC 
GAGACGTGGG TGCGTGCGGT CGGCGATCGC CCCTTGCCGC TGGTCGAGCG GCTGGAGTCC 
GACCTCGCGA CGATCGACGA GGGGCTCCGG TTCGGTGAGG TCGTCCCCGC GTCACCCGAC 
GCGATCCGCG TCAGGGGCCT CCCGGAAGAC CTGCTCTCGC GGGCACAGGG CGTGGACGCG 
GACGCGGCCC GCGTGGCCGT GGAGACGAAC GCGGTCGCCT TCGACACCGA GCAGGCCGGA 
ACGCGAGCGG CCGGGTCGGT CGCGTTCGCT GACGACGAGG TGTCGCCCGG ATACGACGAC 
CTCGTCGCAG ACCTCGCGGG CGTGTTGGAG CGCGGGTACG ACACGGTCGA CATTACCGAC 
GGCGCCGTGA TAGCGCGCGA GACCGCGTTC GATCCCGAGC TCGCCGCCAA GCGTGGGGTC 
CCGGAGGGGC CGGCGTTCGG GCGGCTCGCG AGCGGGGAGT CGGTCGAAGT CGACGGCGAA 
ACGATCGCGC CGGCGGACGT GTCGCGAGAG CGGACAAACC GATTCCCGAT CGACTCCCCC 
ACTGACTCCG CCGCCGAGCC CCCTACCGAA CCCTCTGAGT GA

Protein sequence

MIAIVVSRAD SASEHIGEHL LDLGDWERRD DPSRPDADGG GTYYRTDGFE LREFDDLHIY 
LDDPAAAFGG GAGDETNDAA SDDTDETPEF LAFVSRHSGE TGELLTAHVT GNFGPAPYGG 
EPDTLARAAP GAEKRVVEAL AAHAPEGYDV GIECTHHGPT DTSVPSLFVE LGSDEPQWTD 
ADAARAVARA VLDLRGTDAD LVTDAGETTD EIDDDPHPRH VVGFGGGHYA PRFTRIVRET 
EWAVGHVGAD WALGELGAPD ANRDVIEQAF ARSKANVAVI EGEKPDLEAT VEALGHRVVS 
ETWVRAVGDR PLPLVERLES DLATIDEGLR FGEVVPASPD AIRVRGLPED LLSRAQGVDA 
DAARVAVETN AVAFDTEQAG TRAAGSVAFA DDEVSPGYDD LVADLAGVLE RGYDTVDITD 
GAVIARETAF DPELAAKRGV PEGPAFGRLA SGESVEVDGE TIAPADVSRE RTNRFPIDSP 
TDSAAEPPTE PSE