Gene Dshi_1974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1974
Symbol
ID	5712968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	2087391
End bp	2088665
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	73%
IMG OID	641267897
Product	hypothetical protein
Protein accession	YP_001533314
Protein GI	159044520
COG category	[S] Function unknown
COG ID	[COG3864] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0525296
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.788975
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGCG CGCAATCCCA CAGCCGCCGC GCCACCCATG CGCTGCAAAA GCTGTCGGAG 
GCCGATCCGG CGCTCGCCGC TCTCGCGCTC TGGTGCGCCC ACCGCGACGC CGATCTTGCG 
GGCGACCTGC CCGCCGACAG CGACGGGCAC ACCATCCGCT ACGCACCCGG CTTCGCGGCG 
CTGTCGCTGC CGGAGCAGAT GGGCCTCTGC GCCCACCACA TCCTGCACAT CGCCCTGCGC 
CATTCCGCCC GCAGCGAAAC GCTCCGCCTG CGGCTCGGAC CCGGCTTCGA TCCGGACCTC 
TTCGGCATCG CCGCCGACAT CCTGATCAAC GAAACCCTGC TGCAGGCGGG CTATATCCAG 
CCCCGCCCCC ATGTCAGCCA CGCCACCGTG AAACGCGAGC TTGGCATCGA CAGCCCCGCC 
GACCTGCTCC GGAGCTTCGA CGCCGAACGC CTCTTCACGG AGATGCGCCG CGACGCCGCC 
GCGAAGCCCG AGGGCCAGGG CAAGACCGAC AAGATCAAGG CCATGGCGGG CGCGGACGGC 
TTTCGGCCCG ACATCGCCCC CAGCCCCACG GGCGAGGACG GCGACGAGGA CACGCCCGAG 
GCCCGCGATT TCGAGTGGCG CCAGCACCTC GCCCGGGCGC TGGAGGCCGG CAAACTGGCT 
GGCCGGGGGA TCGGCGCGCT CGGCTTCCGG CTCGCCGACA TCCCCGAGAC CACCACCCCG 
TGGGAGGTGA TCCTGCGCGG CCTGCTGGAC CGCGCGACAC GGGCCGACCC GCGCCGCAGC 
TTCCGCCGCC CCGCGGGCCG CTGGGTCGCG GGCGAGGCCG AGGCGCGCGC ACGCGGCCGC 
CCCGTCCCGG TCTTCGAGCC CGCCCTGCAG CGCGAGACGA CCCAGCCCCG GATCGTGCTG 
GCCATCGACA GCTCCGGCTC GGTCACCGGC GATCAGCTGG CCCATTTCGC CGCGCAAATC 
GCCCGGATCG GGCGCCGGGT GCTGGCCGAG ATCCACGTGC TGATCTTCGA CGAGACCGTG 
CAATCGGCCC ACAAGATGCG CGGCACCCAC TGGGCCGCGA CCCTGGCGGG CTGGGACTTC 
GCCCGCGACG GTGGGACGAG TTTCGTCGAT GTGCTGGAAC GCGCCGCCGC GCTGACCCCC 
TCGGCGGTCG TGGTGCTCAC CGATCTCGAC GGCCCCATGG GCGCCGCACC CGGCCGCGCC 
CCGGTAATCT GGGCCTGCCC CAAACCACCC GAGAGCCCCC CACCCTTCGG TCGCGTGCTG 
GTGCTGGACC GCTGA

Protein sequence

MSRAQSHSRR ATHALQKLSE ADPALAALAL WCAHRDADLA GDLPADSDGH TIRYAPGFAA 
LSLPEQMGLC AHHILHIALR HSARSETLRL RLGPGFDPDL FGIAADILIN ETLLQAGYIQ 
PRPHVSHATV KRELGIDSPA DLLRSFDAER LFTEMRRDAA AKPEGQGKTD KIKAMAGADG 
FRPDIAPSPT GEDGDEDTPE ARDFEWRQHL ARALEAGKLA GRGIGALGFR LADIPETTTP 
WEVILRGLLD RATRADPRRS FRRPAGRWVA GEAEARARGR PVPVFEPALQ RETTQPRIVL 
AIDSSGSVTG DQLAHFAAQI ARIGRRVLAE IHVLIFDETV QSAHKMRGTH WAATLAGWDF 
ARDGGTSFVD VLERAAALTP SAVVVLTDLD GPMGAAPGRA PVIWACPKPP ESPPPFGRVL 
VLDR