Gene Hlac_1092 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1092
Symbol
ID	7400164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1095643
End bp	1096947
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	67%
IMG OID	643708158
Product	Extracellular ligand-binding receptor
Protein accession	YP_002565757
Protein GI	222479520
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.629609
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAGGAA ATCCCGCGGA TAGTGTCAGT AGACGGTCGT TTGTCAAATA CAGCGGTGCG 
GCCGGCGTCA CCGGTGCCCT GGCTGGCTGT AGCAGTAACG GCGGCGACGG CGGCGACGGC 
AGTGATGGCG GCGACGGCGG CGATGGTGGT AGCGGCGGAG GCGGTGACGG AAGCGACGGC 
GGCGACGCCC CAGACGAGGT GATCATCGGG TCGAACCACC CGCTGAGCGG GGCGCTCAGC 
AACACCGGCG AGCGCATGGA CCAAGCGGTC CGACTGGCCG CGATGATGAA GAACGAGTCG 
GGCGGCATCG AGTCGCTCGA CGGGGCAGAG CTCAGCGTCA TCAGCGGGGA CAACGAGGGC 
GCACAGGAGC TCGGCGGCGA AGTCGCCCAA GAGCTCATCG ACGACGGTGC CAGCGTGCTG 
ACCGGCTGCT ACTCCTCGCC GGTGACGAGC GCCGCGACCC GGACGTCGGA GAGCGCGGGC 
GTGCCGTTCG TCATCTCGGT GTCCGTGGCC AACTCGATCC TGCGGGAGAC GCAGCTCAAC 
TACGCGTACC GGCCCCAGCC GCCGGCGGAC CAGATGGCGA TCGACCACGC GCGACTCCTC 
GCTGACACCA TCCGGAACGC CGGCGAGGAG ATCGAGACCG CGGGGCTGTT CTACATCGAC 
ATCAGCTTCG GCCAGTCGAT CCGCGACGCG CTCCGGGAGG AGCTCCCGGC GAACGACATC 
GAGATCGTCG CCGAGACCGC CTACGAGCCG GGCGACACCG CAGACACGCA GGTCACGTCG 
CTCCGGGACG CGGACCCCGA CGCCGTCATC GCGACCACCT ACCGGTCGGG GACGATCGAG 
CTCGTCAACG CGATGGACAA CCAGAACTAC CAGCCGGACT ACGTGACCGG CTGTTCGAAC 
GCGGCGATGA ACGACATCAG TGCGCTCGAA GAGATGGGCG ACACCGTAGA GGGCGGGTTC 
GCAACCAACT TCGCGCTCGA CCCGACGTCC GACCGCGCCG GCGAGGTCCG ATCGCGCTTC 
GAGTCGGAGT TCGACTCCGG ATTCGACGCG AACGTCGCGA TGACCTACGC GGCCACCGAG 
GTCATCATCG CGGCGATCGA GGAGGCGGGC TCGGCCGACC CCGAAGACAT CAACAATGCG 
CTCGGAGAGA TCACCGTCGA GGATCACATC GCGGCGATGC CGCCTATCAC CTTCGCCGAC 
AACGGTGAAA ACGAGAACGC GCTCGCTCCG CTGTTCCAGA TTCAGGATCT CGAGGACCGC 
GTCGTCGCAC CCGAGGAGTT CGCCGAGACC GACGCGCAGT TCTGA

Protein sequence

MGGNPADSVS RRSFVKYSGA AGVTGALAGC SSNGGDGGDG SDGGDGGDGG SGGGGDGSDG 
GDAPDEVIIG SNHPLSGALS NTGERMDQAV RLAAMMKNES GGIESLDGAE LSVISGDNEG 
AQELGGEVAQ ELIDDGASVL TGCYSSPVTS AATRTSESAG VPFVISVSVA NSILRETQLN 
YAYRPQPPAD QMAIDHARLL ADTIRNAGEE IETAGLFYID ISFGQSIRDA LREELPANDI 
EIVAETAYEP GDTADTQVTS LRDADPDAVI ATTYRSGTIE LVNAMDNQNY QPDYVTGCSN 
AAMNDISALE EMGDTVEGGF ATNFALDPTS DRAGEVRSRF ESEFDSGFDA NVAMTYAATE 
VIIAAIEEAG SADPEDINNA LGEITVEDHI AAMPPITFAD NGENENALAP LFQIQDLEDR 
VVAPEEFAET DAQF