Gene Spro_2011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_2011
Symbol
ID	5603983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	2203400
End bp	2204521
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	58%
IMG OID	640937549
Product	cupin 4 family protein
Protein accession	YP_001478242
Protein GI	157370253
COG category	[S] Function unknown
COG ID	[COG2850] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0220075
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTATC AATTAGATCT GGACTGGAAC GATTTTTTGC AACGTTATTG GCAAAAGCGT 
CCGGTGATTC TGAAGCGTGG CTTCAAAAAC TTTATCGATC CGATCTCCCC GGATGAGCTG 
GCTGGGCTGG CGATGGAAAA CGAAGTGGAC AGCCGTTTGG TTAGCCACCA GGACGGCCGC 
TGGCAGGTCG CTCACGGCCC ATTTGAGAGC TTTGACCACC TGAGCGAGAA CAACTGGTCG 
CTGCTGGTGC AGGCAGTCGA TCACTGGCAT GAGCCTTCCA GCGCGCTGAT GCGCCCGTTC 
CGCCAACTGC CGGACTGGCG GATGGACGAT CTGATGATTT CGTTCTCGGT GCCGGGCGGC 
GGTGTTGGCC CGCATTTCGA TCAGTACGAC GTGTTTATCA TTCAGGGTAC CGGTCGCCGT 
CGCTGGCGCG TGGGCGAAAA AGTGCCGATG AAGCAGCATT GCCCGCACCC GGACCTGCTG 
CAGGTTGAAC CTTTCGACGC CATTATCGAT GAAGAAATGG AACCGGGCGA TATTCTGTAT 
ATTCCGCCGG GCTTCCCGCA TGAAGGCTAC GCGTTGGAAA ACGCGCTGAA CTACTCGGTG 
GGCTTCCGCG CACCGAATGG TCGTGAACTG ATTAGCGGCT TTGCCGACCA CGTGCTGGCA 
CGCGAACTGG GCAGCAAACG TTACAGCGAT CCGGATATTC AACTGCGAGA GCATCCAGCG 
CAAGTGCTGC CGCAGGAAGT CGACGCCCTG CGCCAGATGA TGCTGGATCT GGTTGAGCAA 
CCGGAACACT TCCAGCAGTG GTTCGGCGAG TTTATCTCCC AAACGCGCCA CGAGCTGGAT 
GCCGCGCCGC CGGAGCCGCC TTACCAGGCA GGCGAAATCT ACGAACTGCT ACAGCAGGGC 
GAGCCATTAC AACGTCTGGG TGGCCTGCGC GTACTGCGCG TTGGTGATCA GTGCTTTGTG 
AACGGCGAAC TGATGGATAC CGAGCATCTG CAGGCTGTCG ATGCCATGTG CCAGAACTTC 
AGCGTTAATG CCACCCAGTT GGGTGACGCG GTGGACGATC CGTCGTTCCT GGCGCTGCTG 
ACCGCACTGA TCAATAACGG CTACTGGTAT TTTAAAGACT GA

Protein sequence

MDYQLDLDWN DFLQRYWQKR PVILKRGFKN FIDPISPDEL AGLAMENEVD SRLVSHQDGR 
WQVAHGPFES FDHLSENNWS LLVQAVDHWH EPSSALMRPF RQLPDWRMDD LMISFSVPGG 
GVGPHFDQYD VFIIQGTGRR RWRVGEKVPM KQHCPHPDLL QVEPFDAIID EEMEPGDILY 
IPPGFPHEGY ALENALNYSV GFRAPNGREL ISGFADHVLA RELGSKRYSD PDIQLREHPA 
QVLPQEVDAL RQMMLDLVEQ PEHFQQWFGE FISQTRHELD AAPPEPPYQA GEIYELLQQG 
EPLQRLGGLR VLRVGDQCFV NGELMDTEHL QAVDAMCQNF SVNATQLGDA VDDPSFLALL 
TALINNGYWY FKD