Gene Dshi_1749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1749
Symbol
ID	5713316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	1814843
End bp	1815970
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	66%
IMG OID	641267667
Product	carboxylate-amine ligase
Protein accession	YP_001533092
Protein GI	159044298
COG category	[S] Function unknown
COG ID	[COG2170] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02050] uncharacterized enzyme

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.589468
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.393571
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACCC CAGAGTTCAC CCTTGGCATC GAGGAGGAAT ACCTCCTCGT CGACCGCGAC 
AGCCTGCAAC TTGCCGAGGC GCCCGAGGCC CTCATGGCGG CGTGTCGCGA CAAGCTGGAA 
GGCCAGGTCA GTCCCGAGTT CCTACAATGC CAGATCGAGA TCGGCACCGG AGTCTGCGCC 
GAAATAGCCG AGGCGCGCGC GGACTTGCGC AAGCTGCGCA GCACGGTCGC GGCGGAGGCT 
GCGCGCTTCA ACCTGGCGCC CATCGCGGCC TCCTGCCATC CCAGTGCCGA CTGGGCCGAA 
CAGCACCATA CCGACAAGGA CCGCTACAAT GACCTGGAAA AGGACCTGGG CGGGGTCGCG 
CGGCGTCTGC TGATCTGCGG GATGCATGTG CATGTGGGGC TTGACGATGA CGACCTGCGG 
ATCGACCTCT TGCCGCAGTT TTCCTATTTC CTGCCCCATC TGCTGGCGCT GTCGTCCTCC 
TCGCCCTTCT GGAAGGGGCA GGATACGGGG CTGGCCTCCT ACCGGCTGAC GGTGTTCGAC 
AACCTGCCCC GGACCGGCCT GCCCCCGGTG TTCAACAGTT GGGCCGAGTA CCAGCGCAAC 
ATCCATGTGC TGATCGATCT GGGCCTGATC GAGGACAGCT CGAAGATCTG GTGGGATCTG 
CGCCCGTCGC ACAACTTCCC CACGCTGGAG AGCCGGATCT GCGATGTCTG CCCGCGGCTG 
GAGGATACCT TGAGCCTGGC CGCCGCGACC CAGGCCCTAA TGCGGATGCT CTGGGGGCTC 
AAGACGCACA ATATGCGGTG GCGCGCCTAT GATCGCTTCC TGATTTCGGA GAACCGCTGG 
CGGGCGCAAC GCTACGGCGC CCGCGGCAGC CTGATCGATT TCGGCCGCGG CGCGGTGGTC 
GACAGTACCG AGCTGGTCGA GGAGTTGATC GAGCTGATCG GTGCCGATGC GAGGGCCCTG 
GGCGGGTTGG CGGAGGTCGA GCGCCTGCGC GAGATCGCTG CGGACGGCTC GAGCGCGGAT 
CGCCAACGCG CTGTACGCCG CGCGGCCCTG GAGGCCGGGC AGAGCGACGC GGAGGCGATG 
AACGCCGTGG TGCGCCACCT GATCGAGGAA TTCCACCGCG ACCTGTGA

Protein sequence

MSTPEFTLGI EEEYLLVDRD SLQLAEAPEA LMAACRDKLE GQVSPEFLQC QIEIGTGVCA 
EIAEARADLR KLRSTVAAEA ARFNLAPIAA SCHPSADWAE QHHTDKDRYN DLEKDLGGVA 
RRLLICGMHV HVGLDDDDLR IDLLPQFSYF LPHLLALSSS SPFWKGQDTG LASYRLTVFD 
NLPRTGLPPV FNSWAEYQRN IHVLIDLGLI EDSSKIWWDL RPSHNFPTLE SRICDVCPRL 
EDTLSLAAAT QALMRMLWGL KTHNMRWRAY DRFLISENRW RAQRYGARGS LIDFGRGAVV 
DSTELVEELI ELIGADARAL GGLAEVERLR EIAADGSSAD RQRAVRRAAL EAGQSDAEAM 
NAVVRHLIEE FHRDL