Gene Tneu_1839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tneu_1839
Symbol
ID	6164755
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoproteus neutrophilus V24Sta
Kingdom	Archaea
Replicon accession	NC_010525
Strand	+
Start bp	1617017
End bp	1618237
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	62%
IMG OID	641669002
Product	threonine synthase
Protein accession	YP_001795202
Protein GI	171186283
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACCCC ACATAGGTCC TCTATTTAAA TCTTTTCACA TCCAAAAAGG TTATAAGGAG 
AGGTTTTTCT CCGGGCATGG CCGTTTCGGG GACAATCCCT ACCTCAAGTG CATAAGTTGC 
GGGGCAACCT ACGCCCAAGA CTACCGGCTC TACCGGTGCC CAAAATGCGG CGGTCTCCTC 
GACGTGGTTG TGCCGGGGAA GTACTGGGCG CCAAAGGGCA GAGGCCTCTG GCGCTACGCC 
ACCATGCTAC CCCTTAGAGA TGGGGTATCC CTCGGCGAGG GTCAGACCCC CCTCGTCAAA 
TCCAACCTAG ACGGCCACCT ATACGTCAAG TTCGAGGGGG CCAACCCCAC CGGTAGCTTC 
AAGGACCGGG GCATGGCGCT GGGCGTCACG GTGGCTAAAG AAAGCGGCGC GTCGAAGGTC 
GTAGTGGCCT CCACCGGAAA CACCGCCGCC TCAGCGGCCG CCTACGCCGC CAGAGCCGGG 
CTGAAGTGCT ACGTGGTTCT GCCGAGGGGC AACGTGGCTA GAGGCAAGCT CATGCAGGCG 
GCGCTACACG GAGCCGAGTT GCTCATGGTG AGCGGCCTCT TCGACAAAGC CCTTGAATAC 
GTGGTAACCC ACGGCACCAG GTACGCGTAT CCGCTGAACA GCTTCAACCC CTGGAGGCTC 
GAGGGGCAGA AGACCCTGGC TTTCGAGGTG TACGAGGAGC TCGGTTGCCC AGACTACGTG 
GTGGTGCCCG TCGGAAACGC CGGCAACATT GCCGCGATAT GGAAGGGCTT CAAGGAGTTG 
GGCGAGCTGG GCCTATGCAA GAAGTTGCCC AAGATGGTGG GGGTACAGGC GGAGGGGGCC 
GCCCCCCTTG CCAACGCGTG GCAGAGGGGG CTCAAGGAGC CTCTCTTCAT CGACGAGCCG 
GAGACCGTCG CCACCGCCAT AAAGATCGGA AAACCTATAA ACTGGCCTAA GGCCATGGCG 
GCCGTGCGGG AGTCAGGCGG CTTCTTCATA GCTGTTTCAG ACGGCGAGAT ACTCAAAGCG 
CAGAGGCTAC TCGCGTCGAG AGACGGCATA GGGGCTGAGC CGGCCGGCGC CGCGTCGGTC 
GCGGCGGCGC TGAAGCTGAA GCTAAACGGC ACCGTGGTGG CGGTTGTCAC AGGACACGCC 
CTTAAGGACC CAGACGCCGT GGAGATAAAC GCTCGGGAGG TGAGAAACGC CGAGGAGCTC 
GTCGAGCTGT TGGAGAAATG A

Protein sequence

MPPHIGPLFK SFHIQKGYKE RFFSGHGRFG DNPYLKCISC GATYAQDYRL YRCPKCGGLL 
DVVVPGKYWA PKGRGLWRYA TMLPLRDGVS LGEGQTPLVK SNLDGHLYVK FEGANPTGSF 
KDRGMALGVT VAKESGASKV VVASTGNTAA SAAAYAARAG LKCYVVLPRG NVARGKLMQA 
ALHGAELLMV SGLFDKALEY VVTHGTRYAY PLNSFNPWRL EGQKTLAFEV YEELGCPDYV 
VVPVGNAGNI AAIWKGFKEL GELGLCKKLP KMVGVQAEGA APLANAWQRG LKEPLFIDEP 
ETVATAIKIG KPINWPKAMA AVRESGGFFI AVSDGEILKA QRLLASRDGI GAEPAGAASV 
AAALKLKLNG TVVAVVTGHA LKDPDAVEIN AREVRNAEEL VELLEK