Gene Franean1_1804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1804
Symbol	trpD
ID	5670206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2166921
End bp	2168219
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	77%
IMG OID	641240725
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_001506148
Protein GI	158313640
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.204599
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAACAA CGACTGCAGA CGGACACGAC ATGACGAGCA CCGCCTCGGA GCCGCGGGCG 
ACGACGGCCG CGGCCTCCCC CCTCCCGACG GCCGCCTCTT CCCCGGCCGA GTCCCCCTCC 
CCGGGCGTCA CCGCTGCCGG GGGGGCCCGG GCCACCGCCG AGAGCTGGCC GGATCTGATC 
ACCGACCTGA TCGCCGGGCA GGCGCTGGCC GCCGACCGGA CGGCGTGGGC CATGGAGCAG 
ATCATGGGCG GGCTGGCGAC GCCGTCCCAG ATCGCCGGCT TCGTGGTGGC GCTGCGGGCC 
AAGGGTGAGA CCGCCCAGGA GATCGGCGGG CTGGTCCGCA CGATGCTCGG CTTCGCCGAG 
CCGCTCACCC TCAGCGAGGA GCTGCGCGCC GCCGCAGTCG ACACCTGCGG AACCGGCGGC 
GACCGCTCGA ACACCGTGAA CCTGTCGACC ATGGCCGCGA TCGTGGCGGC CGGCGCCGGG 
GTCACCGTGG TCAAGCACGG TAACCGCGCG GCGTCGTCGG CGAGTGGGTC GGCCGACGTG 
CTGGCCGAGC TCGGCGTTGT CATCGACCTG CCGCCGGCCG GGGTGGAAGC GTGCCTGGCC 
GCCGCGGGGA TCGCCTTCTG CTTCGCCCCG GTCTTCCACC CGGCGATGCG GCACGTCGGC 
GCCACCCGCA AGGAGCTGGG GGTGCAGACC GCGTTCAACA TCCTCGGCCC GCTGGCGAAC 
CCGGCGCGGC CGGGCGCCCA GACGATCGGC GTGGCCGACG CGCGGCTGGC CCCGGTCGTC 
GCCGACGTGC TCGCCGAGCG GGGAACCCGG GGCCTCGTCT TCCGCGGCGA CGACGGACTG 
GACGAACTCA CCACGGCCAC CACGTCGACC GTGTGGGTCG TCCAGGCGCC CGACCCCACG 
TCCAGCCGCA CGCCGGGTTC CACGGCCGGC TCCGTGGCCG GGAGCGCGTC GGAGGCCGCG 
GCGGTGCGCC GCTCCCGGGT TCGTTCGGAG CACTTCGACC CTCGCGACCT CGGCCTCGCC 
CGGCCGGACA CGACCGCGCT GCGGGGCGCG GACGCCGCCT ACAACGCTTC CGTGGCCCGG 
GCCATGCTGC GCGGGGAGAC CGGGCCGGTC CGCGACGCGG TGCTGCTCGC CGCGGCCGCG 
ACCCTGGTCG CGGTGGACGG CCCCACCGAC GCCCCGGTGG CCGAGCAGAT AGCGGCCCAG 
CTCGGGCGCG CCACCGAGGC CGTCGACTCC GGTGCCGCCG CGGCCGCGCT GAGCCGCTGG 
GCCGAGGCCA GCCAGCTCGC GGCGACGGCC CGGGGCTGA

Protein sequence

MRTTTADGHD MTSTASEPRA TTAAASPLPT AASSPAESPS PGVTAAGGAR ATAESWPDLI 
TDLIAGQALA ADRTAWAMEQ IMGGLATPSQ IAGFVVALRA KGETAQEIGG LVRTMLGFAE 
PLTLSEELRA AAVDTCGTGG DRSNTVNLST MAAIVAAGAG VTVVKHGNRA ASSASGSADV 
LAELGVVIDL PPAGVEACLA AAGIAFCFAP VFHPAMRHVG ATRKELGVQT AFNILGPLAN 
PARPGAQTIG VADARLAPVV ADVLAERGTR GLVFRGDDGL DELTTATTST VWVVQAPDPT 
SSRTPGSTAG SVAGSASEAA AVRRSRVRSE HFDPRDLGLA RPDTTALRGA DAAYNASVAR 
AMLRGETGPV RDAVLLAAAA TLVAVDGPTD APVAEQIAAQ LGRATEAVDS GAAAAALSRW 
AEASQLAATA RG