Gene Daro_1557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1557
Symbol
ID	3568642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	1670119
End bp	1671408
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	55%
IMG OID	637680025
Product	hypothetical protein
Protein accession	YP_284776
Protein GI	71907189
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	3.4261e-20
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.109896
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCTC ACAAAGCAGA AACCACTGGC TCCCTGAAAC TGACCTGCCT GTCAGTGATG 
CTGGCTCTTG CCGGCCTTTC TTCTGCAACC GCCCAGGAAG CAGTGGATAC CGAGAAGCTG 
TTCAAGGAAG GCATTTTCCT GCGCGAGCAA GGGCAAGTAT TCAGCTCCAT CGAAGCCCTC 
GAAACAGTTC TGAGCAACAA CCCTGCACTC AATCGTGCCC GTCTTGAACT GGCCGTCGCC 
TACTATCGTG CGCTGAACTA CGACCAAGCC AACCAGCAGG CGCAAAAGGT TCTTGACGAC 
CCGAAGACCC CGGAAAACGT TCGTCTCGCC GTGCTGGCCT TCCTTGCCCA GATCAAGCGT 
GACCAAGTTG CACTGGTCGC CAAGCCGCAT ACGTTTGAAG GCTCCATCTC TCTTGGGGCT 
CAATACGACT CCAACGTCAA CGTGGGTCCC GGCGGCGCCA TTCTTCCCGG TGGTCTGATT 
CTCGACCCGG GTTCTGTTCC CAAGCACGAT TGGGCTTCCG TTATTCAGGC TGGCGTTACT 
CATACCTACA ACTCTCCGAG CGTTGTGCGA CTCGGTGAAA CAGCAACCCG CTTCCTCTGG 
CAGACCAGCG CTGGTCTTTA TCAGAAGAAC TACTTCAGCG TGACTGATTT CAATCTGACC 
GCACTCAGCC TATCGACCGG TCCTGTCCTT ATTGCCCCGG ACAAGTGGCG CGCCAAACTC 
AACCTGCAGG TTGATGGCCT GTGGCTGGGC GGCAACTTCC TTGGCGTCTA CACCTCGCTT 
TCTCCGACGG TTACCTTGCA ATTCAAGAAT GGCGAGTTGA CCTGGGACGC TTTGGTGCTG 
AACAAGGCTT TTGATCGCAC TATCGATGTC GGCCGCGACA GCAACTACTA CTCTACCGGC 
GTTTCCTATG GCCACCTGTT CCTGCAAGGC AAGCTGGCGC TTCAAGGCGG CCTGCACGTC 
TTCATGGAAG ATGCCTCGGC CAGCCGTTAC AGCAATGATG GTTGGGAAGC CTTCGTTGGC 
GCCAATGTAG TTGCTTGGCA AAACGGTAAT GTTTATGGTC GCTACAGCTA CAAAGACACC 
AAGTTTGATG GTGTTGAGCC GGTATTTGCC CTCGCCCGCG ACGAATACGA AAAACGCTAC 
GAAGTCGGTT TCGGCCACAA CTTCAAGGAA GGCTTCGCGA AGGATTGGCG TCTGTCTGGC 
AGCTGGCAGA AAACGGAGAA CAACTCCAAT GTCAGCATCT ACACTTACAG CCGTCAAATC 
GCTGGCGTTT CGATCGGTCG CTCGTTCTGA

Protein sequence

MNAHKAETTG SLKLTCLSVM LALAGLSSAT AQEAVDTEKL FKEGIFLREQ GQVFSSIEAL 
ETVLSNNPAL NRARLELAVA YYRALNYDQA NQQAQKVLDD PKTPENVRLA VLAFLAQIKR 
DQVALVAKPH TFEGSISLGA QYDSNVNVGP GGAILPGGLI LDPGSVPKHD WASVIQAGVT 
HTYNSPSVVR LGETATRFLW QTSAGLYQKN YFSVTDFNLT ALSLSTGPVL IAPDKWRAKL 
NLQVDGLWLG GNFLGVYTSL SPTVTLQFKN GELTWDALVL NKAFDRTIDV GRDSNYYSTG 
VSYGHLFLQG KLALQGGLHV FMEDASASRY SNDGWEAFVG ANVVAWQNGN VYGRYSYKDT 
KFDGVEPVFA LARDEYEKRY EVGFGHNFKE GFAKDWRLSG SWQKTENNSN VSIYTYSRQI 
AGVSIGRSF