Gene Hhal_0206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0206
Symbol
ID	4710968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	236704
End bp	237741
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	69%
IMG OID	639854665
Product	TPR repeat-containing protein
Protein accession	YP_001001802
Protein GI	121997015
COG category	[S] Function unknown
COG ID	[COG4700] Uncharacterized protein conserved in bacteria containing a divergent form of TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.719616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGACAC CGAGAAAGGG AATGGTCGGG CTGTTGCTGG CGGTCGTCAT CGGCGTCAGC 
ACCGCCATCT ACCTCCGCAT CCACCCCGAT ATCGTCCACT TCCGGCTCGC CGAGTGGCTC 
GATCACCTCG ACCGCGGCGC GGTGGCCACC GATCACCTTG AGCGCAGCAT CGCGGCGGGG 
CTGGATCACC CGGACCGGCT GCGCGAGGCG ACCCTCACCC TGCTCGGACG CGATGAGGCC 
GAGCCGGCCT TCGTCGGCGC ATGGCGCCTG AATCAGAGCG ACGCCCTGGA CCCCGGGACA 
CGCTCGGCCT TCGCCGGACA CTTCGATCGC CTCGGCCAAC CCGAACGTGC CCTGGCGCTT 
TACGAGTCGA ACGACGGACT CGGCCCCGCC GGGATCATGC ACCACGCCTC GCTACTGGAC 
CGCGCCGGAC AGCCCGAAGC CGCCATGACA CGCTATCGGG AACTGCTCCG GGAGCTGCCC 
GCGGAGCGGG TCGACACGGG CCAGAGCACG AAACCGGAAG ACCTGGCAGA CCCCGAAACC 
ACCCAGGCCC GGCTGGAACT GGCCCGCCTG CTGGCCGAGC GCGGGCGGCA CGACGAAGCG 
ATCACCGAGT ACCGGAGGGT CCTCGACGAC CAACCGGAAC ATCAGACCGC CCGGCTCGGC 
CTGGCCCGCA CCCTCTTCTG GGCCGGCGAC ACCGAACGGG CCGCTGCCGA GATCGACGGC 
CTCGAGACCA CCGACCTGGA GCCGCAGGAC CGGCTCATGC TGGCCGACCT GCAGCTCAGC 
CGTGGCGGCT ACGAAAGGGC CATCGACCTC TACCGGGATT ATCTGGAGGG CCACCCGGAC 
GACCAGGAGA CCCGGTACAA GAAGGCGCTG GCCCTGGCCT GGTCGGCCCG TTACGACGCC 
GCCATCGAGG CCTTTGACCA GGTTCTCCAG GCTCGACCAC ACGACCGGCA GCTGATGCGC 
CAGTTCGCTC AGGTTCTGAC CTGGGCCGAT CAACCCGACC GCGCCATCGA GCTCCTGCAG 
AAAAGCCTGG AGGACTAG

Protein sequence

MPTPRKGMVG LLLAVVIGVS TAIYLRIHPD IVHFRLAEWL DHLDRGAVAT DHLERSIAAG 
LDHPDRLREA TLTLLGRDEA EPAFVGAWRL NQSDALDPGT RSAFAGHFDR LGQPERALAL 
YESNDGLGPA GIMHHASLLD RAGQPEAAMT RYRELLRELP AERVDTGQST KPEDLADPET 
TQARLELARL LAERGRHDEA ITEYRRVLDD QPEHQTARLG LARTLFWAGD TERAAAEIDG 
LETTDLEPQD RLMLADLQLS RGGYERAIDL YRDYLEGHPD DQETRYKKAL ALAWSARYDA 
AIEAFDQVLQ ARPHDRQLMR QFAQVLTWAD QPDRAIELLQ KSLED