Gene Spro_1808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_1808
Symbol
ID	5605243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	1992358
End bp	1994013
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	58%
IMG OID	640937340
Product	putative dehydrogenase subunit
Protein accession	YP_001478039
Protein GI	157370050
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000111783
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000501686
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAAAC CTGTATTTAC CGCCGATGGC AACGTCTCGG CCGATATTGT GATCGTAGGC 
TCCGGCATCG TCGGCGGCAT GATGGCCGAT CAATTGGTCA GCCAGGGTTA TTCTGTGCTG 
GTGCTGGAAG CGGGCTTGCG CATCGAACGC GGCCAGGCGG TAGAGAACTG GCGCAATATG 
CCTTTTGACA ACCGCGCCGG CTCAGATTAC CAGGGGCTGT ATCCACAATC TGAATTCGCC 
ACCGCGCCGC TCTACTTCCC GGAAAACAAC TATGTTGCGC TGAGCGGCCC GAGCGCCGGC 
AGTTTCAAGC AGGGTTATCT GCGCACCGTC GGCGGCACCA CCTGGCACTG GGCCGCCTCC 
TGCTGGCGCC ACCTGCCCAG TGATTTCCAA ATGAAAACGC TGTACGGCGT TGGCCGCGAC 
TGGCCGATTT CCTACGACGA GCTGGAACCC TACTATTGCC GGGCCGAAGA AGAAATTGGC 
GTCGCCGGCC CCAACGATCC GCAACAGCAG TCCCCGGTTG AGCGCAGCAA ACCTTACCCG 
ATGGATATGG TGCCCTGGGC TCACGGCGAC ATCCGCTTTG CCGAGGTGGT AAACCCGCAT 
GGTTACCGCT CCGTTCCCAT CCCACAGGGG CGCAGTATCC ATCCGTGGAA AGGCCGGCCG 
ACCTGCTGCG GTAACAATAA CTGCCAACCC ATTTGCCCGA TAGGCGCCAT GTACAACGGC 
ATTCATCATA TTGAACGTGC TGAAATGAAA GGTGCGGTGG TGCTGGCCGA AGCGGTGGTC 
TACAAGATCG ACACCGATGA GCAAAATCAG GTGACGGCAG TCCATTGGCT GGACAACAAA 
AAACAGTCCC ACCGGGCCAC GGCCAAAGCT TTTGCGTTAG CCTGTAACGG CATAGAAACC 
CCGCGCCTGC TGCTGATGGC GGCTAATGAG CGCAATCCCA ACGGTATCGC CAACGCTTCC 
GATCAGGTGG GCCGCAATAT GATGGACCAT TCGGGCTTTC ACTGTACCTT CCTGGCGAAA 
GAACCGCTGT GGCTGGGGCG TGGCCCGGCA CAAAGCAGTT GTCTGGTTGG CCCACGTGAC 
GGTGAGTTTC GCAAAGACTA CTCGGCCAAC AAAATGATCC TCAACAATAT CAACCGGGTG 
GTACCGGCTA CCCAGCAAGC GTTGGAAAAA GGTCTGGTCG GCAAAGAGTT GGACGCCGAA 
ATCCGCCGAC GCGCCGCCTA TGGCGTCGAT TTATCCATCA GCCTGGAACC GTTACCAGAC 
CCCAACAACC GCCTGACCCT GAGTAAAACC CGGAAAGATG CTCATGGCCT GCCTTGCCCG 
GACATCCACT ACGACGTCGG CGACTATGTG CGTAAGGGCG CAGAGGCCGC GCATAAACAG 
TTGGAGCACA TCGGCCAACT GTTTGATGCC GATGAATTCA ACATCACCAC CAGCCTGAAC 
GCCAATAACC ATATTATGGG TGGCACCATC ATGGGCCACA GCCCCGAAGA CTCGGTGGTA 
GACGGCAATT GCCGTACTCA TGACCATGCC AACCTTTGGT TGCCGGGCGG CGGTGCCATT 
CCCTCCGCCA GCGTGGTGAA CAGCACCCTG ACCATGGCCG CATTGGGCAT CAAGGCCGCC 
GATGATATTG CGCGCCAGCT GGCGGTGAAA TCATGA

Protein sequence

MKKPVFTADG NVSADIVIVG SGIVGGMMAD QLVSQGYSVL VLEAGLRIER GQAVENWRNM 
PFDNRAGSDY QGLYPQSEFA TAPLYFPENN YVALSGPSAG SFKQGYLRTV GGTTWHWAAS 
CWRHLPSDFQ MKTLYGVGRD WPISYDELEP YYCRAEEEIG VAGPNDPQQQ SPVERSKPYP 
MDMVPWAHGD IRFAEVVNPH GYRSVPIPQG RSIHPWKGRP TCCGNNNCQP ICPIGAMYNG 
IHHIERAEMK GAVVLAEAVV YKIDTDEQNQ VTAVHWLDNK KQSHRATAKA FALACNGIET 
PRLLLMAANE RNPNGIANAS DQVGRNMMDH SGFHCTFLAK EPLWLGRGPA QSSCLVGPRD 
GEFRKDYSAN KMILNNINRV VPATQQALEK GLVGKELDAE IRRRAAYGVD LSISLEPLPD 
PNNRLTLSKT RKDAHGLPCP DIHYDVGDYV RKGAEAAHKQ LEHIGQLFDA DEFNITTSLN 
ANNHIMGGTI MGHSPEDSVV DGNCRTHDHA NLWLPGGGAI PSASVVNSTL TMAALGIKAA 
DDIARQLAVK S