Gene Daro_2198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2198
Symbol
ID	3566653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	2373387
End bp	2374382
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	58%
IMG OID	637680667
Product	aminodeoxychorismate lyase
Protein accession	YP_285407
Protein GI	71907820
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.955684
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCACCC TGACCAAGAT TCTTTTCGCT GTTTTTGTGT TGTTCGCGAT CGCGGCTGGC 
GGGCTGTGGT GGTGGGCAAA TCAGCCATTG TCGCTGCGCT CTTCACCGCT CGATTTTCGT 
ATTGCGGCCG GTAGCAGCCT GCGTTCGGCG ATTACCCAGA TGCGGGAGTC GGGTATTGAG 
GTCGAGCCTG GCTTGCTCGC CTTCCTGGCA CGGCTTAACC GGGCCGATAC GGCCATCAAG 
GCAGGTAGCT ATGCGGTCAA GGATGGGGTA ACCCCGATCC GCCTGCTGGA TAAATTGCTC 
AAGGGCAAAG TTACGCAAGG TGAACTGACC CTGGTTGAAG GCTGGACTTT TCGGCAATGG 
CGAGCCCGTC TGGATAAACA TCCGGATCTG AAGCACGAAT TGCTTGGCTT GAGCGAAGCG 
GAAATCATCG AAAAGCTGGG TTTGAGCGTT GCAGGACTGG AAGGGCAGTT GTTCCCGGAT 
ACTTATCTGT TCGACAAACA ATCCAGCGAT CTCGAACTGC TCGCGCGGGC CCAGCGGGCC 
ATGCAGCGCA AACTGGATGC GGAATGGGCA GGCCGCGCCG CCGGTCTTCC CTACAAAACT 
TCGAATGACG CGCTGATCAT GGCATCCATC GTCGAGAAAG AAACCGGGCG CGAATCGGAT 
CGAGAGCTCG TTGCCGCAGT CTTCGTCAAT CGCTTGCGCA AAGGGATGTT GCTGCAGACT 
GATCCGACTG TGATCTACGG CATTGGCGAG AAATTTGATG GCAATCTGAG AAAGCGCGAC 
CTGCTCACGG ACACCCCGTA CAATACCTAC ACCCGTCCTG GCTTGCCGCC AACGCCGATC 
GCGATGCCGG GGCAGGCTTC CATCAGGGCG GCGCTGAATC CGGCGCCCAG CGACGTCATC 
TATTTCGTGG CTCGAGGCGA TGGCAGCAGT GAATTTTCCC GGACCCTGGA CGAACACAAC 
CGGGCGGTTA ACAAATATCA GAGAGGTGGG AAGTGA

Protein sequence

MRTLTKILFA VFVLFAIAAG GLWWWANQPL SLRSSPLDFR IAAGSSLRSA ITQMRESGIE 
VEPGLLAFLA RLNRADTAIK AGSYAVKDGV TPIRLLDKLL KGKVTQGELT LVEGWTFRQW 
RARLDKHPDL KHELLGLSEA EIIEKLGLSV AGLEGQLFPD TYLFDKQSSD LELLARAQRA 
MQRKLDAEWA GRAAGLPYKT SNDALIMASI VEKETGRESD RELVAAVFVN RLRKGMLLQT 
DPTVIYGIGE KFDGNLRKRD LLTDTPYNTY TRPGLPPTPI AMPGQASIRA ALNPAPSDVI 
YFVARGDGSS EFSRTLDEHN RAVNKYQRGG K