Gene Daro_2236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2236
Symbol
ID	3566423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	2415706
End bp	2417370
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	59%
IMG OID	637680705
Product	hypothetical protein
Protein accession	YP_285445
Protein GI	71907858
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0333455
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGCGA CCGTTGTGGC ATCTGTGGAT GCCAATCCCC CCTCTGAACA GTTTCAGGCC 
GTCTCACTCT GGACTTTCGT CCACCTGAAA ACACCTCGCT TTACTTCGGA AGCAGCACTC 
GATGTGGTTC GGCACCTGAT GCCAACCGCT GACGAGGATC CCAAGCATCT CGCGAAACGC 
CTGCGTAAAT CCCTGCTAGA GCACGGCATC GCCCTCAAGC ACGTCAATTC GCTCGATGCG 
GCGGCGCGCC TGCTTGGGCA CGCCGATTGG CACGCGGCAA ATCGCGCGCA GCCGAAGACG 
ACCCTCAAGC TGACGCCGAT GGCCGATGCC GCGGAAGAGT TGTTCGAAGA CTGGCGCCAA 
CTTGCACCAC GTCTGTGTGC ATGGTGCGAT GCATGGCTTC GGGGAAAAGG TGGCAAGGTC 
TTTGAGGTGC GTTTCGGCCC CGGCTATGTC ATGGTCAGCA TTCCTACACC CAAGGAGGGT 
GGGCCGGCAG GAAGCATGGA CGAGCTGCCG CTGCTTATGG TCAATCCCGT CGGGGATGCC 
GAACATTGGT TGCAGGAAGC CCCAGCGGCA TTCGAAACTC TGCGCCGTCA CTTGGAAGAG 
TCCGGACAGG CAGTTCTGGA CGGTGTTGCC GTGCTGCAGT TATGCAATCG CAACAGTCGG 
GAAGCATTGG ACCGTTTGCC GTCGATACCG CAGCCGGTGC GACCAACGGA TGCCGGCAAT 
TCGGAATTGG TCTTGCTGCG CGAGGACGAT GAGCTCATGC CGGGGTCGGG CTACGAGATT 
GCCCGTGGCG ACGAGCTGAC ATGCTGGGCA CAGCTCCATC TGGCGATGAA GGACCACAAG 
TCCGAGGGAA TTACTTTGGA TGACGGGGCC TGGCGGATCG GTGGGGGCCG CTATGTATGG 
CAGTTATCGA CAATCCATCC CAAGGACTTT GTCCCCGGGC TGGTGATCAC GATGCTGAGC 
GAGACCGATT CGGAGAAGCT GCTGCGTCGC TACAAGCTTG TACAGCGGGT ACTTTCGCAA 
AACTTCAAGC ATCATGAGGT GACCAAGCGC TTACAGTACT TGAGTGGCCC GTCGGATATC 
TACCGTGTTG ATTTGCACAA ACTGCTATTG GCATTGAACG ACGCGGGTCT GACCTGGGAG 
GGCTTTTGCC AGGAGGTCGA GGTGCAGCAG GCAATGGTCC CCGAGCTGCC CGTTGGTTTC 
GCGATGACCA TCATCGAACG GCTCAAGCCG AAGGACCCGA ATCTCTTCTT CGCACTGCCG 
AGCCGTGCAG AGCTGGCCCG AGCCGATGAC GATTCCCTGC TGCGGACCTT GTTGCCCCGC 
ATTGACATCG TGCGGTACCG GATCGTGCGT GGCGTGTCCG ATGAAGTTAA GCAGACCGTC 
CGCGACGCGA TTGACGAGTT CGGTACGTCG ATCCGTATGC AGGCGCTGAC GGCTGCAGGG 
CAGCTGACCG ATCCGAACGA TCCGCTGCCG TATCTGGTCT ATGCCGGCGA TGGCGAAGAA 
CTCCGACTAA AGCTCGAATC TGAAGGGCTC GTAATGTACG CGGGAGTCAT GCCGCATTTG 
TTTCCAACCG AAGGCGTGGT CGAGAAACTG CCCAACATGT GGTCTTACGC CTTCGGACAT 
AGCCTGTTTC TGGATGTCGA CTTCGCGGAA GGTGGTGCGC AATGA

Protein sequence

MTATVVASVD ANPPSEQFQA VSLWTFVHLK TPRFTSEAAL DVVRHLMPTA DEDPKHLAKR 
LRKSLLEHGI ALKHVNSLDA AARLLGHADW HAANRAQPKT TLKLTPMADA AEELFEDWRQ 
LAPRLCAWCD AWLRGKGGKV FEVRFGPGYV MVSIPTPKEG GPAGSMDELP LLMVNPVGDA 
EHWLQEAPAA FETLRRHLEE SGQAVLDGVA VLQLCNRNSR EALDRLPSIP QPVRPTDAGN 
SELVLLREDD ELMPGSGYEI ARGDELTCWA QLHLAMKDHK SEGITLDDGA WRIGGGRYVW 
QLSTIHPKDF VPGLVITMLS ETDSEKLLRR YKLVQRVLSQ NFKHHEVTKR LQYLSGPSDI 
YRVDLHKLLL ALNDAGLTWE GFCQEVEVQQ AMVPELPVGF AMTIIERLKP KDPNLFFALP 
SRAELARADD DSLLRTLLPR IDIVRYRIVR GVSDEVKQTV RDAIDEFGTS IRMQALTAAG 
QLTDPNDPLP YLVYAGDGEE LRLKLESEGL VMYAGVMPHL FPTEGVVEKL PNMWSYAFGH 
SLFLDVDFAE GGAQ