Gene Daro_1130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1130
Symbol
ID	3570148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	1237096
End bp	1238436
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	62%
IMG OID	637679597
Product	hypothetical protein
Protein accession	YP_284356
Protein GI	71906769
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGATG ATTCTCAGGG AACCCCGGAG GAAAATTCCG CCCCGGTTCC CCACGGACGC 
TGGTCGCGCC TGGCCCGTCT GGGCTCATTG GCCGGCGGCG TGGCCGGCAA TATGCTGGCC 
GAGGGCGCCC GCCAGTTTGC ACAAGGCAAG CGGCCAAAAA TCCAGCAACT ACTGCTGACG 
CCGGCCAATG CCCGCCGGGT GGCCGATCAA CTGGCGCAAC TACGCGGTGC GGCCATGAAA 
GTGGGGCAGC TGCTATCGAT GGATGCCGGC GAACTGCTGC CGCCCGAACT GGCCGACATT 
CTTGCCCGAC TGCGCGCCGA CGCCATCCCG ATGCCGATGA GCCAGGTGGT CAAGGTGCTC 
AATACCAACT GGGGCGAAGG CTGGGATCGC CATTTCGAGC GTTTCTCCTT CACCCCGATG 
GCAGCAGCCT CGATCGGCCA GGTGCATTTC GGGCAAAGGA AAGATGGCCG CCACTTGGCG 
ATCAAGATCC AGTACCCCGG CGTTCGCCAG AGCATCGACA GCGATGTCGA CAATGTGGCC 
ACCCTGCTCC GTGTTTCCGG CCTGCTGCCC AAAACGCTGG ACGTCAAACC ACTACTGGAA 
GAAGCCAAAA AGCAATTGCA TGACGAAGCC GATTACCGTC GAGAGGGCGC CTGCATGATG 
CAGTTTGCCG GCCTGCTGGC CGATGCCGAC GAGTTCATGG TGCCGGAAAT GCACGACGAT 
CTGACCACGG AAAACATCCT GGCGATGACC CGCCTGGATG GCGTGGCCGT CGAGTCCCTG 
AGCCATGCCC CGCAGGCGGA GCGGGACCGC ATCATCAGCC AGTTATTCAG GCTGCTGTTT 
CGCGAGATTT TCGAATTCCG GCTAATCCAG ACTGACCCGA ACTTCGCCAA TTACCGATAC 
GCCGCCGCGT CACAGCAGCT CATGCTGCTC GACTTCGGCG CTACCCGGGT GTACCCCGCG 
GCCATGATCG ACAGCTATCG CCACCTGATG CTCAGCGCCA TTGCCGATGA TCGTTCGGCG 
ATGAACCAGG CGGCCCAGGC GATCGGCTAT TTTCAGAGCG ATATTAAGGA GGGGCAGCGC 
CAGGCTGTGC TGGATATTTT CGCGCTGGCC TGCGAGCCGC TGCGACAGGC AGGAGAATAC 
GATTTCGGCA GTTCCGATCT GGCGCTGCGA ATTCGTGACG CGAGCATGGT ACTCGGCATG 
GATCGGGATT TCTGGCACAC CCCACCGGCG GATGCGCTCT TTCTGCATCG CAAGCTGGGC 
GGCCTGTATC TGCTGGCAGC AAGGCTCAAG GCGCGGGCGA ACTTGCATGA AATCGCTGCC 
CGCCACTTGC TGGCCGGCTA G

Protein sequence

MSDDSQGTPE ENSAPVPHGR WSRLARLGSL AGGVAGNMLA EGARQFAQGK RPKIQQLLLT 
PANARRVADQ LAQLRGAAMK VGQLLSMDAG ELLPPELADI LARLRADAIP MPMSQVVKVL 
NTNWGEGWDR HFERFSFTPM AAASIGQVHF GQRKDGRHLA IKIQYPGVRQ SIDSDVDNVA 
TLLRVSGLLP KTLDVKPLLE EAKKQLHDEA DYRREGACMM QFAGLLADAD EFMVPEMHDD 
LTTENILAMT RLDGVAVESL SHAPQAERDR IISQLFRLLF REIFEFRLIQ TDPNFANYRY 
AAASQQLMLL DFGATRVYPA AMIDSYRHLM LSAIADDRSA MNQAAQAIGY FQSDIKEGQR 
QAVLDIFALA CEPLRQAGEY DFGSSDLALR IRDASMVLGM DRDFWHTPPA DALFLHRKLG 
GLYLLAARLK ARANLHEIAA RHLLAG