Gene Daro_3021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3021
Symbol
ID	3568689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3266400
End bp	3267863
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	59%
IMG OID	637681492
Product	hypothetical protein
Protein accession	YP_286221
Protein GI	71908634
COG category	[S] Function unknown
COG ID	[COG2308] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	0.0262026
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.733965
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACCTG CTGAAACCTG TACGAGAGCA TCCTCAGCGA CGAGTGGAAA AATGAACTTC 
TATAACGAGA TGTATGACGC CAATGGCGGT GTCCGTGCGC ACTACAAGGG GTACGAAGAC 
TGGCTCAAGG CAACTCCACC CGAGCGCATT GAGCGTAAGC GGGCCGAAGC CGATCTGGCC 
TTTCATCGGG TCGGTATTAC CTTTGCGGTC TATGGCGAGG AGGCTGGCAA GGAGCGCCTG 
ATTCCCTTCG ACATCATTCC CCGCGTCATT CCATCGACTG AGTGGAAGGC GCTGCAGTCC 
GGGCTGCGCC AGCGCGTCAA GGCGTTGAAC ATGTTCCTGT GGGACGTCTA CCACGATCAG 
GAGATTCTAA AGGCCGGCAT CATTCCTGCC GAGCAGGTGC TGAACAACGC GCAGTATCGT 
CCGGTCATGA AAGGTGTTGA TGTGCCGGGC GGGATTTACG CGCACATCAC CGGCGTTGAT 
ATTGTGCGGG CCGGTGAGGG CGAGTTCTAC GTGCTGGAAG ACAATCTGCG CGTACCGTCC 
GGCGTGTCAT ACATGCTTGA AGATCGCAAG ATGATGATGC GTCTTTTCCC CGAACTGTTT 
GCCAAGCACA AGGTGGCACC GGTTCAGCAT TACCCGGACA TGCTGCTGGA GAAACTGCGC 
GCCGTGGCGC CACAGGGTGT ATCGAACCCG ACAGTCGTCG TGCTGACGCC GGGTGCCTAC 
AACAGCGCCT ATTTCGAACA CACCTTCCTC GCCCAGCAGA TGGGCGTCGA GTTGGTCGAA 
GGTCGTGACC TGTTCGTCAA GGACGAAGTG GTCTATATGC GGACGACGCA GGGGCCGCAG 
CGGGTTGATG TGATCTACCG CCGCCTCGAC GATGACTTCA TGGACCCGAC AGTCTTCCGC 
GAAGATTCAT CGCTCGGCGT GCCGGGCATC ATCCGAGCCT ATCAGGCCGG CAATGTGACG 
CTGGCGAACG CGGTTGGCAC TGGTGTCGCC GATGACAAGT CGATCTATCC CTACGTGCCG 
GAAATGATTC GCTTCTACCT CGGTGAGGAA CCGAAGCTGA ATAATGTACC GACCTACATG 
TGCCGCAAGC CGGATGATCT GGCCTACGTG CTTGATCACC TGCCGGAACT GGTGGTCAAG 
GAAGTGCATG GCGCCGGTGG TTACGGCATG TTGGTCGGCC CGGCTTCGAC CAAGGAGCAG 
ATCGAACATT TCCGCAAGTT GCTGATCGAC AAGCCGGATG GCTACATTGC CCAGCCGACG 
CTGGCGCTGT CCAACTGTCC GACTTTCGTC GAAGAGGGCA TCGCGCCGCG CCACCTTGAC 
CTGCGCCCCT TCGTCCTGTC GTCTGGAGAG TGCGTGAACA TGGTGCCTGG CGGCCTGACT 
CGCGTCGCGC TGACCAAGGG CTCGCTGGTC GTGAATTCGT CGCAGGGCGG CGGTACCAAA 
GACACCTGGG TTCTGGAGGA TTAA

Protein sequence

MEPAETCTRA SSATSGKMNF YNEMYDANGG VRAHYKGYED WLKATPPERI ERKRAEADLA 
FHRVGITFAV YGEEAGKERL IPFDIIPRVI PSTEWKALQS GLRQRVKALN MFLWDVYHDQ 
EILKAGIIPA EQVLNNAQYR PVMKGVDVPG GIYAHITGVD IVRAGEGEFY VLEDNLRVPS 
GVSYMLEDRK MMMRLFPELF AKHKVAPVQH YPDMLLEKLR AVAPQGVSNP TVVVLTPGAY 
NSAYFEHTFL AQQMGVELVE GRDLFVKDEV VYMRTTQGPQ RVDVIYRRLD DDFMDPTVFR 
EDSSLGVPGI IRAYQAGNVT LANAVGTGVA DDKSIYPYVP EMIRFYLGEE PKLNNVPTYM 
CRKPDDLAYV LDHLPELVVK EVHGAGGYGM LVGPASTKEQ IEHFRKLLID KPDGYIAQPT 
LALSNCPTFV EEGIAPRHLD LRPFVLSSGE CVNMVPGGLT RVALTKGSLV VNSSQGGGTK 
DTWVLED