Gene Daro_4141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_4141
Symbol
ID	3566641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	4440073
End bp	4441170
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	58%
IMG OID	637682613
Product	hypothetical protein
Protein accession	YP_287337
Protein GI	71909750
COG category	[S] Function unknown
COG ID	[COG3287] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	76
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCAC TACAAGGGCT GGAGGCCGAT TTTCTGCTGA TTTTTGGCAG TATCGATCAT 
TTCAACGCTC CTGGCATGAG CCAAACCCTG AATGAGGCTT TTCCCCGCGC CATTCTGCTC 
GGCTGTTCAA CCGCTGGCGA AATTACGCCT GATGGTGTTG ATGATGGCAC CTGCACCGTC 
ACTGCGATCG ATTTTGAACA AACCCGCCTG ACACATGGCA GCACCCGCTT GACTGGCATG 
GACGACTCCT TTGCCGCCGG AGAACGAGTG GGCCGCCAAA TTGGCGCAAC AGATCTCAAG 
GCAGTGCTCG TGTTCGGTCC TGGCGTCAAG ATCAATGGCA GCGCCTTGGT CAGTGGCATT 
GCCAGCGCCA TCGGCAACGG AATCCCGATT ACCGGGGGCC TCGCCGGGGA TGGCGGCGCC 
TTCAGGGAAA CCTTCACCAT CGGCCCCGAG GGGGTCGCCA ACGATAAAAT TGTGGCAGTG 
GGCCTTTGTG GCGAAGGGCT CCGCTTCGGC CACGGCTCCT TCGGCGGCTG GGAGCCTTTT 
GGCCCGGCCC GCAAGGTAAC ACGCTGTACA GGCAATATTC TGCATGAACT GGATGGCGAA 
CCGGCACTGG AAATTTACCG GCGTTATCTA GGCGATCATG CCAGGAACCT GCCGGCCTCC 
GGCCTACTTT TCCCGTTTGC CATGCTCGGC GAAGACCATA ATGCCATCGG TCTGATCCGG 
ACCATTCTTG GTATTGATGA AGAGACGGGC AGCCTTATCC TGGCCGGCGA AATCGATCCC 
GACGGCTACC TTCGACTGAT GCACGCCAGC ACCGACAAGC TGGTCAATGG CGCCGAGGCC 
GCTGCGGAAG CGGCCGCAGC CATGCTGCAA TCAAGCGGTA CCACTTTGGC CATTCTGGTC 
AGTTGCGTCG GCCGCAAGTT GGTCATGGGC AACCGCGTAG ATGAGGAAGT AGAGGCCGTT 
GGCGAAGTTT TTGGCAACAA GGCGGTCCTG ACCGGCTTCT ATTCTTACGG CGAGATCAGC 
CCTTTCACGC CGGGCGCATC CTGCAAGCTG CATAACCAAA CTATGACCAT TACCTGCCTC 
AGCGAGAACC AAGCTTAA

Protein sequence

MTALQGLEAD FLLIFGSIDH FNAPGMSQTL NEAFPRAILL GCSTAGEITP DGVDDGTCTV 
TAIDFEQTRL THGSTRLTGM DDSFAAGERV GRQIGATDLK AVLVFGPGVK INGSALVSGI 
ASAIGNGIPI TGGLAGDGGA FRETFTIGPE GVANDKIVAV GLCGEGLRFG HGSFGGWEPF 
GPARKVTRCT GNILHELDGE PALEIYRRYL GDHARNLPAS GLLFPFAMLG EDHNAIGLIR 
TILGIDEETG SLILAGEIDP DGYLRLMHAS TDKLVNGAEA AAEAAAAMLQ SSGTTLAILV 
SCVGRKLVMG NRVDEEVEAV GEVFGNKAVL TGFYSYGEIS PFTPGASCKL HNQTMTITCL 
SENQA