Gene DET1481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DET1481
Symbol	trpE
ID	3229289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dehalococcoides ethenogenes 195
Kingdom	Bacteria
Replicon accession	NC_002936
Strand	+
Start bp	1339193
End bp	1340650
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	50%
IMG OID	637121041
Product	anthranilate synthase component I
Protein accession	YP_182181
Protein GI	57233826
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATTACC CATCTTTAGC CGAAGTAAAA AAACTGGCCG CACAGGGCAA CCTGATACCC 
ATCTCCTGTG AGATTATGGC CGACCTTGAA ACCCCGGTTT CCGCTTTTCT GAAAATCAAA 
GACAGCCAAA ATGCTTTTCT GCTGGAAAGT GTGGAAGGCG GGGAGCGCGT AGCCCGATAT 
AGTTTCATCG GCACCAACCC CCATAAAGTG CTTACAGCCT ATCAGACAGA TACCGTTCCC 
CCTCTAACCC AAGTTGAAAA TGAACTAAAC AAATACCGGG TAGTACCGGT GGGGGATTTG 
CCCCGTTTCT GCGGCGGGGC GGTGGGTTTT CTGGGCTACG AGGCAGTTAC CCGCTTTGAG 
GAGTTGCCCT CGCCATCGGC TGACCCCCTA AATCTTCCGG AAGCAGTCTT CATGCTGGTT 
GATACCATGC TGGTTTTTGA CCACATCAGC CATTCCATAA AAGTACTAAG CTATGTCCAT 
ACCGAACAGG ATATTGAAAC GTCATATAAT CAGGCTATCC GGAATATAGA AAATCTGGTT 
AACCGCCTTA GAAAGCCGCT GCCCGAAACC GCCCCAAAAT CTACCGCCGC AAGTATCCCC 
GAAATGAAAT CCAATTTCAA ACAGGCGGAT TTTGAGGGCA AGGTATCCAA AATAAGAGAT 
TACCTTAACT CAGGCGAAGC TATTCAGGTA GTTTTGTCAC AGCGTCTGTC CAGACCCACC 
TCCGCCCATC CCTTTGACAT CTACCGTGCC TTGCGTTCGG TAAACCCTTC ACCATACATG 
TACTATCTGG ATTTCGGTGA TTTCCAGATT GTGGGCGCCT CGCCGGAGGT ACTGGTACGG 
GTGGAAGACG GCGAGGTTAT GACCCGCCCT CTGGCAGGCA CCAGAAAACG GGGCAAAACC 
CAGAAAGAAG ACACCAGTCT TGAGCAGGAA CTCCGCCATG ACGAAAAAGA GTGTGCCGAA 
CATATCATGC TGGTGGATTT GGGACGAAAC GATATCGGGC GTATAAGCCA GCCGGGCACA 
GTCCGCATAA CCGACGTCAT GGATGTGGAA CGCTATTCCC ACGTAATGCA TCTGGTTTCC 
CACGTACAGG GCAAATTAAA ACCAAACATT ACTCCGTTTG AGGCTTTGCA ATCCTGCTTC 
CCGGCAGGCA CAGTCTCAGG CGCACCTAAA ATACGAGCTA TGGAAATAAT AGCTGAAATG 
GAAACCGAAA AGAGAGGCAT TTATGCCGGG GCAGTCGGAT ATTTTTCTTA TTCGGGCAAT 
ATGGACATGG CTATAGCCAT ACGCACCATG GTTGTCAAGG GAGGCATTGC CCATATCCAG 
GCAGGCTGCG GCATAGTAAG TGACAGCGTA CCCGAACATG AGTATCAGGA AACATTAAAC 
AAAGCTCAGG CTTTGCTGAA AGCTCTGGAC AGGGCAGAAA ATCAGGCATC GGAGAAACCG 
CATGTTATTA CTAATTGA

Protein sequence

MYYPSLAEVK KLAAQGNLIP ISCEIMADLE TPVSAFLKIK DSQNAFLLES VEGGERVARY 
SFIGTNPHKV LTAYQTDTVP PLTQVENELN KYRVVPVGDL PRFCGGAVGF LGYEAVTRFE 
ELPSPSADPL NLPEAVFMLV DTMLVFDHIS HSIKVLSYVH TEQDIETSYN QAIRNIENLV 
NRLRKPLPET APKSTAASIP EMKSNFKQAD FEGKVSKIRD YLNSGEAIQV VLSQRLSRPT 
SAHPFDIYRA LRSVNPSPYM YYLDFGDFQI VGASPEVLVR VEDGEVMTRP LAGTRKRGKT 
QKEDTSLEQE LRHDEKECAE HIMLVDLGRN DIGRISQPGT VRITDVMDVE RYSHVMHLVS 
HVQGKLKPNI TPFEALQSCF PAGTVSGAPK IRAMEIIAEM ETEKRGIYAG AVGYFSYSGN 
MDMAIAIRTM VVKGGIAHIQ AGCGIVSDSV PEHEYQETLN KAQALLKALD RAENQASEKP 
HVITN