Gene Daro_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1039
Symbol
ID	3568201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	1139088
End bp	1140494
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	58%
IMG OID	637679500
Product	hypothetical protein
Protein accession	YP_284265
Protein GI	71906678
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGGCA AGTCCCAAAA GGAAACGGAT ATGTCGAAGC ACCAAGAGAA TGGCCGCGAT 
GGCCTCACCG AGCAGCAACC CCAAAACCTG ACCGCCACTT CCCTGGCCGC CGCCCGCACC 
GCGCGCGAGG CGCGGGCGGA CGGTGGACAA GAAGTGGCGG AACCTGCCTT TGAGGGTGCG 
CTCCCTAGTA ACACAGCACC CTATAACAGC AATACAGGAC AGGAATGGTT TAAAGCCCTT 
CGTTGGGGCG TTGATAGCTT GTACCTTTCC TATCCCGGCG AACTCTCCCG AGAGTCAGAC 
CTTCGCCTCA AGGAACTGAA GCAATTCGCA CAATCCAATG ATCCCGGCGA GGTAGCAAAG 
GCCCAGTTGC CACTGGCTGG TCATATCTTC GAGGTGAAGG AAAAAGGCGC GTCGCTATTC 
CCCTACATCC TGGAAGATGG CGCTTTCCGT ATTCAGCTTT CCCGGCCAGG CCACAAAGCC 
CCGATGGCCT ATGTGAAGGT ATCGGCCAAG TTCCTGGCCC ATGTCGGCCC GGTCGGAGCC 
GAACGCCAGC TGTATGCCTT GCTCTCCGAG TTGGGCGAGC TCAAGGAATC GGCCAACGTC 
AGCCGAATTG ACCTGTTTGT CGATTTCCAA AGCGGTTTCG ATATGGAAGG CTGGGATCGT 
CATGCCTGGG TGACGCGGGC CTCCTCGATC AACAGCTATG CCGTGTCCGG GCAGTTCTCC 
GGCTGGTCAG TGGGTCTTGG TGGGAACATC TCGGCCAGGC TCTATAACAA GCTCCTGGAG 
ATCGTCGTCA GCGGCAAGGA ATGGATCATT CCCCTATGGC AGAAATCCGG TTGGGATGCC 
TCGGCTCTGG TGTGGCGTCT GGAGTTTGAG ATCAAGCGGG AAGTCCTGAC TCAGAAGGGC 
CTTTCCAAGC TCGCTGAGGT GATGAGCAAC TTGAACGGGT TATGGGACTA CGCAACAACG 
GAATGGCTGC GCCTGACGCT GCCCAATGCG GAGGACAAGA CCCGTTCCCG GTGGCCGATT 
CATCCTCTGT GGCTGTATCT ATCTGCCGTC GATTGGGAGA GCAAAGGCGG CCCCCTGGCT 
AAACGTTTCA GTCCGAGCCG CAGCCCCAAT GACGACAAGC TATTCCAGAT CGGCTACAGC 
GCGATTCTGT CGTACATGGC CAAGCATGGT TTCCCAGCTT CGGAGTTGTA CGAAGGCTGC 
GAGGATTTCC TGGCCAGTGC CTATGCCTAT CACGAGCAGA AGGCGCTTGA CCTGGGCCTG 
CCCTTCGAGG ACTTCATTGC TGAGAAGCTG GCCCTGAAGC ATCGCCAGTA CAACACGGCG 
GTCAATGATC CCGACCAGGA AGCCAAGCGC AAGGCCAAGG CCCTGGAGGA TGAAGCCAGG 
GCTTACCGGA AAGCCTCGGG GGGCTGA

Protein sequence

MPGKSQKETD MSKHQENGRD GLTEQQPQNL TATSLAAART AREARADGGQ EVAEPAFEGA 
LPSNTAPYNS NTGQEWFKAL RWGVDSLYLS YPGELSRESD LRLKELKQFA QSNDPGEVAK 
AQLPLAGHIF EVKEKGASLF PYILEDGAFR IQLSRPGHKA PMAYVKVSAK FLAHVGPVGA 
ERQLYALLSE LGELKESANV SRIDLFVDFQ SGFDMEGWDR HAWVTRASSI NSYAVSGQFS 
GWSVGLGGNI SARLYNKLLE IVVSGKEWII PLWQKSGWDA SALVWRLEFE IKREVLTQKG 
LSKLAEVMSN LNGLWDYATT EWLRLTLPNA EDKTRSRWPI HPLWLYLSAV DWESKGGPLA 
KRFSPSRSPN DDKLFQIGYS AILSYMAKHG FPASELYEGC EDFLASAYAY HEQKALDLGL 
PFEDFIAEKL ALKHRQYNTA VNDPDQEAKR KAKALEDEAR AYRKASGG