Gene Daro_3418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3418
Symbol
ID	3568314
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3671192
End bp	3672190
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	65%
IMG OID	637681890
Product	KpsF/GutQ
Protein accession	YP_286617
Protein GI	71909030
COG category	[M] Cell wall/membrane/envelope biogenesis [T] Signal transduction mechanisms
COG ID	[COG0794] Predicted sugar phosphate isomerase involved in capsule formation [COG2905] Predicted signal-transduction protein containing cAMP-binding and CBS domains
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.000032508
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.585789
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCCAA GCCCTAAACC CCATCGCTTT TCGCCGGAAC GCGCTCTGGA ACTGGGTCGC 
CAGACCCTGA GCATCGAGGC TGCCGCCGTA GAGGCCCTGC AGGGCCGAAT CAACGGCGAT 
TTCGCCAAGG CCGTCGAGCT GATACTCAAC AGCCACGGGC GTCTGATCGT CAGCGGCATG 
GGCAAGTCCG GCCATATTGC CCGCAAGATC GCCGCGACCA TGGCCAGCAC CGGCACCCCG 
GCCTACTTCG TCCATCCGGC CGAAGCCAGC CATGGCGATC TCGGCATGAT CACTCGCGAT 
GACGTGCTGC TTGCCCTGTC GAACTCCGGC GAATCCGGCG AACTGCTCAG CATCCTGCCC 
GCACTGAAGC GCCAGGGCGC CAAGATCATC TCAATGACCG GCGTTCCGAC CTCAACGCTG 
GCTCGTGAAG CCGACATTCA TCTCGACGCC GGCGTCGAAC AGGAAGCCTG CCCGCACAAT 
CTGGCCCCCA CGGCCAGCAC CACGGCGGCA CTCGCCCTGG GTGATGCCCT GGCTGTCGCC 
CTGCTCGATG CCCGTGGCTT CGGGCCGGAA GATTTCGCCC GTTCGCACCC CGGCGGCTCG 
CTCGGCCGCC GCCTGCTGAC CCATGTTCGC GATGTCATGC GCGCCGACGA CAAGGTTCCC 
GCCGTCACTC CGGCCACCCC CATCACCGAC GCGATCATCG CCATGTCGCG TGGCGGCCTC 
GGGCTCGTCG CAATCACCGA TCCGGCCAAT ATCGTCCTCG GCATCTTTAC CGACGGTGAC 
CTGCGTCGCG CTTTCGAAAA ACGCATCGAC CTGCAACAGG GCGACATTGC CTCGGTCATG 
CACGCCGCGC CGCGCACCAT CGGCCCCGAC CGCCTGGCCG TCGAAGCCGT CGAAATGATG 
GAGCGCCTGC GCATCAACGC CCTGCTCGTC GTCGATGCTG AAAATCACCT GATCGGTGCG 
CTGAACATGC ACGATCTCTT CACTGCCAAG GTTATCTGA

Protein sequence

MNPSPKPHRF SPERALELGR QTLSIEAAAV EALQGRINGD FAKAVELILN SHGRLIVSGM 
GKSGHIARKI AATMASTGTP AYFVHPAEAS HGDLGMITRD DVLLALSNSG ESGELLSILP 
ALKRQGAKII SMTGVPTSTL AREADIHLDA GVEQEACPHN LAPTASTTAA LALGDALAVA 
LLDARGFGPE DFARSHPGGS LGRRLLTHVR DVMRADDKVP AVTPATPITD AIIAMSRGGL 
GLVAITDPAN IVLGIFTDGD LRRAFEKRID LQQGDIASVM HAAPRTIGPD RLAVEAVEMM 
ERLRINALLV VDAENHLIGA LNMHDLFTAK VI