Gene Athe_1696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1696
Symbol
ID	7409206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1782378
End bp	1783748
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	37%
IMG OID	643716067
Product	Chorismate binding-like protein
Protein accession	YP_002573563
Protein GI	222529681
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAGG TGGCAAACGT GCGCCCCGAT AGCTCATCGG GGCTTTTTTG TTATCATGAT 
ATTAGAAATA GTATACCTTT CTTTGAAGAA TATTCAAACG ATTCAATTGA CCTATCAAAT 
ATAGATTTTG ATTCAATCGA GGGGGATTTC TTTTTCTTTG AAAATTCCCA GATGGCAGCA 
TTTTGCACTG ATAGGTTGTT ATGTATCACA GTTTACCATG ACAGGACCGA GATTGATTTT 
GAAGGGACTA TAGATGTTTT CTATGGCGAT GTTTCTGCAA TGCTTGATAG CATATTGGAA 
ATCTTAATTC AAAAGAATGC TTATATCACC TGTCAATTTA ACTATCATGC AGTAAATTTG 
TTAGAAGACA TATATTCTGC TGACAGTCCC TATATAGTTC TAAATGTTTA CAGAAAAAAT 
GTACTTGTTG ATAAACTTAC AGGCAAGAAA ACTCTTTTGG TGAGCAAGGA ATCTGAAAAA 
GATGCAGAGG TAGATTTTAA GAGGTACCAG AGAAGTTTGT TTGATGTAAA AAGCAATGTG 
GTCTTTTCAA CACCAAAAGA GTACTTTATC AGCACAGTCA AGCAGGCAAA AGAGGATATC 
AGAAATGGTG AGATTTTTCA GATTGTTCTG TCTCAGATAA TATTGGTCAA AAGCAATATA 
TCAACAAACC ATCTTTTTTA CACAATGAAA GAGAGAAATC CTTCAGAGTA CAGCATTGTG 
ATAAACAATG AAGAAAGCCA AGTGATTTGT TTTTCGCCAG AGACTCTTAT AAAGAAAAAA 
GGAAACACAG TAAAGACATT TCCAATTGCA GGAACGTACA GGATAAACGA AGGCGATGAT 
GTTGCCCAGA AAAAGATTGA GATACTGAAA GACAAGAAAG AGATAAGTGA ACATGTCATG 
CTTGTTGACC TTGCGCGAAA TGATCTTGGA AGGATTTCAA AACCCGGGAC TGTAAAAGTA 
GAAGAGTACT TGAGAATAAA AAGGCTTTAT AATCTCATTC ATATATATTC AGTTGTTACA 
GGTGAACTTG AAGAAAAGAG CCTCACAAAA ACGATACTAT CTGTTTTTCC GGCCGGGACG 
CTGACCGGCG CACCCAAGAT AAGAGCTATG CAGCTAATTG AAAAGTACGA AAGGCAGAGA 
AGAGATCTTT ACGGAGGAGC AATTGGATAT ATCTACAAAG ACCAGTTTGA CCTTGCCATA 
GCTATAAGAA TGGCTGTGAA GGACAAAAAG GAAAGCATTA TCAAGCTTCA AAGTGGTGCG 
GGAATTGTAA ATTTGTCAGT GCCTGAGAAT GAGTATCAGG AGTGTTTGAC CAAGCTCAGA 
GCGTTTTTGA GGATAATGGA GGTGAATGAG GATGATATTG TTAATAGATA A

Protein sequence

MEKVANVRPD SSSGLFCYHD IRNSIPFFEE YSNDSIDLSN IDFDSIEGDF FFFENSQMAA 
FCTDRLLCIT VYHDRTEIDF EGTIDVFYGD VSAMLDSILE ILIQKNAYIT CQFNYHAVNL 
LEDIYSADSP YIVLNVYRKN VLVDKLTGKK TLLVSKESEK DAEVDFKRYQ RSLFDVKSNV 
VFSTPKEYFI STVKQAKEDI RNGEIFQIVL SQIILVKSNI STNHLFYTMK ERNPSEYSIV 
INNEESQVIC FSPETLIKKK GNTVKTFPIA GTYRINEGDD VAQKKIEILK DKKEISEHVM 
LVDLARNDLG RISKPGTVKV EEYLRIKRLY NLIHIYSVVT GELEEKSLTK TILSVFPAGT 
LTGAPKIRAM QLIEKYERQR RDLYGGAIGY IYKDQFDLAI AIRMAVKDKK ESIIKLQSGA 
GIVNLSVPEN EYQECLTKLR AFLRIMEVNE DDIVNR