Gene Tneu_1178 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tneu_1178
Symbol
ID	6165099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoproteus neutrophilus V24Sta
Kingdom	Archaea
Replicon accession	NC_010525
Strand	+
Start bp	1068466
End bp	1069734
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	65%
IMG OID	641668328
Product	anthranilate synthase
Protein accession	YP_001794553
Protein GI	171185634
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.265376
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCC CGCTGTCTAA GCTCCCGCCT CCGAGGGATC TGGCCCACGG GCTGTACCAG 
TCGGGGGAGG AGTTCGTGGC TCTTCTGGAG TCGGGCCAGG GATTCGCGGA GAGGGCGAGG 
TTCACCCTCG TGGCGTGGGG GGTGGAGAGG GCGTACGTCT CCTCTGGGCC CGACCTCCAG 
CAGGTGCTCT ACTCGGCGCA AAGGGAGCTG AGGGCGGACG GGGGGCCCTT CGGCGGCGAC 
GTGTTAATCG GCGCCTTGAC CTACGAGGCG TCCTACTACG TGGAGCCTCT GTTGCTTAGG 
TACAACAAGG TGGACCGGTC TATCCCGGCG GCGTTTCTGG TTAAGCCCAG GGGGTACATC 
CTGTACGACA AGATGCTGGG GAGGGGCTAC CTGAGGGGCG AGATGCCGAG GGTCTCCGTG 
GGGCGGGGGG AGGCCAGGGT GAGGGGGCCG GTGGCCATGA CCGACCCGGG CCGCTTCAAG 
AGCTGGGTGG CGGAGGGGAG GGAGAGGATC GCGGCTGGGG AGATCCTCCA GGTGGTGCTC 
TCCAGGTGGG TGGACTACAG GGCGGAGGGG GACCTCTTCC CTCTGTACAA GGCGCTGGCG 
GAGGGGAACC CCTCGCCGTA TATGTACTTT GTAAAATACG GCGATATCCA CTTGATTGGG 
ACGTCGCCTG AGCTGTTGGT GAAGGTGCAG GGCGGCCGCG TGGAGACCCA CCCCATCGCC 
GGGACTAGGC CGAGGGGCGC CACCGAGGAG GAGGACCTGG CGCTGGAGGA GGACATGCTC 
AGCGACGAGA AGGAGCTGGC TGAACACATC ATGTTGGTGG ATCTGGCTAG GAACGACATC 
GGGAGGGTGT GCCAGCTCGG GTCTGTCAAG GTGGAGGAGC TGTTCGCCGT GGAGAAATAC 
AGCAGGGTGC AGCACATAGT GTCTAGGGTC ATGGGCGTTA TGGACAGGCG GTTCACCCCC 
GTCGACGCCC TCTTGGCCAC CCACCCGGCG GGCACCGTGT CGGGCGCCCC CAAGGTGAGG 
GCTATGGAGA TAATCGCCGA GCTTGAGGAC GAGCCTCGGA GGTTCTACGC GGGAGCCGTG 
GGCTTCATGT CGCCTTCTCT CCTGGAGTTC GCCATAGTCA TAAGGACCAT GGTGGCCGTG 
GGCGACTCCC TCCGTATACA GGCGGGGGCG GGGGTTGTGT ACGACTCCAC GCCGGAGCGG 
GAGTTTAGAG AGACCGAGTC TAAGCTGGCT GCGCTTAAAG CGGTCGTGGA GGGTGGGCCA 
TGGACCTAA

Protein sequence

MKIPLSKLPP PRDLAHGLYQ SGEEFVALLE SGQGFAERAR FTLVAWGVER AYVSSGPDLQ 
QVLYSAQREL RADGGPFGGD VLIGALTYEA SYYVEPLLLR YNKVDRSIPA AFLVKPRGYI 
LYDKMLGRGY LRGEMPRVSV GRGEARVRGP VAMTDPGRFK SWVAEGRERI AAGEILQVVL 
SRWVDYRAEG DLFPLYKALA EGNPSPYMYF VKYGDIHLIG TSPELLVKVQ GGRVETHPIA 
GTRPRGATEE EDLALEEDML SDEKELAEHI MLVDLARNDI GRVCQLGSVK VEELFAVEKY 
SRVQHIVSRV MGVMDRRFTP VDALLATHPA GTVSGAPKVR AMEIIAELED EPRRFYAGAV 
GFMSPSLLEF AIVIRTMVAV GDSLRIQAGA GVVYDSTPER EFRETESKLA ALKAVVEGGP 
WT