Gene Hhal_0124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0124
Symbol
ID	4710621
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	142472
End bp	143611
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	68%
IMG OID	639854582
Product	threonine synthase
Protein accession	YP_001001720
Protein GI	121996933
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCTTCC GACCCCGTTA CACCGGACTG ATCGCCAAGT ACCTGGACCG GCTGCCGATC 
AGCGACGACG CGCGCATCCT CGGGCTGGGT GAGGGGAATA CGCCGCTGAT CCAGCTGACC 
CGCATCCCGG CGGAGCTCGG ACGGGACGTG GATCTCTACG TCAAGTTCGA GGGACTCAAC 
CCGACGGGGT CGTTCAAGGA TCGGGGCATG ACCATGGCGG TCACCAAGGC CGTCGAGCAG 
GGCGCCAAGG CGATCATCTG TGCCTCGACC GGCAACACCT CCGCTTCGGC GGCCGCCTAT 
GCAGCCCGCG CCGGGATTAG CTGCTTCGTG CTCATTCCCG ATGGCAAGAT TGCCATGGGC 
AAACTGGCTC AGGCGATCAT GCACGGCGCT CAGGTGCTGC AGATCCGCGG CAATTTCGAC 
GCCGGCATGC GGCTGGTCAA GGAGCTGGCC GAGCACGCGC CCCTGACGAT CGTCAACTCC 
ATCAATCCGT ACCGCCTGCA GGGGCAGAAG ACCGCCGCCT TCGAGATCAT CGAGGAGCTC 
GAGCGGGCGC CGGATTATCA CTGCCTGCCG GTGGGCAACG CCGGCAACAT CACCGCCCAC 
TGGATCGGCT ATAGCGAGTG CGCCGGCCGC ACGGGCGACG AACAGCTGAC GGCGGCCTGC 
GCCTTCTGCG GGGGGCAGTG CCGGTACGCC TCGGCGCTGG TGGAGCGGCG CCCGCGCATG 
GTGGGCTACC AGGCCAGCGG CAGCGCGCCG TTCCTGCGGG GCGGCCCGGT GGCCGAGCCG 
GAGACGGTGG CGACCGCCAT CCGCATCGGT GATCCGCAGT CGTGGGACTA CGCCCAGGCC 
GTCCGCGAGG AGTCCGGGGG GTGGTTCGAT GAGCTGAGCG ACGAGGAGAT CCTCCAGGCC 
CAGCGCATGC TCGCCGATCA CGAGGGGGTC TTCTGCGAGC CCGCATCGGC GACCTCGGTA 
GCGGGGGCCA TGCGGGATAT CCGCAGCGGC CGCATCCCCG AAGGCAGTAC GGTGGTCTGC 
ACCCTGACCG GCCACGGCCT CAAGGATCCG GATGTGGCGA GCGCCCAGGC CGGCGATGCG 
GTTCAGACCG TGGATGCCGA CTACCAGGCG GTTCGCGAGG CCATCCTGAA GCGGCTTTGA

Protein sequence

MPFRPRYTGL IAKYLDRLPI SDDARILGLG EGNTPLIQLT RIPAELGRDV DLYVKFEGLN 
PTGSFKDRGM TMAVTKAVEQ GAKAIICAST GNTSASAAAY AARAGISCFV LIPDGKIAMG 
KLAQAIMHGA QVLQIRGNFD AGMRLVKELA EHAPLTIVNS INPYRLQGQK TAAFEIIEEL 
ERAPDYHCLP VGNAGNITAH WIGYSECAGR TGDEQLTAAC AFCGGQCRYA SALVERRPRM 
VGYQASGSAP FLRGGPVAEP ETVATAIRIG DPQSWDYAQA VREESGGWFD ELSDEEILQA 
QRMLADHEGV FCEPASATSV AGAMRDIRSG RIPEGSTVVC TLTGHGLKDP DVASAQAGDA 
VQTVDADYQA VREAILKRL