Gene Spro_4904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_4904
Symbol	yieM
ID	5603666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	5442134
End bp	5443597
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	58%
IMG OID	640940480
Product	hypothetical protein
Protein accession	YP_001481124
Protein GI	157373135
COG category	[R] General function prediction only
COG ID	[COG2425] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00108067
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000692167
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTCAGCC TGGAAACACT CGATCTGCTG CTGGCGATCA CCGAAGGTGA ACTGATCGAG 
GAGATGATCA TCGGCATGCT GGCGGCACCG CAGCTGTCGA TTTTCTTCAA AAAGTTTCCG 
GCGATCCGCC GGGCGCTGGA TCGCGACCTG CCGCGCTGGA AGCTACAGCT GAAAGAACGC 
CTGCATGAAG CCATGGTGCC GCCCGCGCTG GCACAGGAAT TCTATCGTTA TCAACAGTGT 
CAGCTAGAGA ACAACACCCA GTTCTTCCAC AACCTTAACG ACACCCTGGA TCTGCTGCGT 
CAGCTGGTTT CTCCCTTTTA TGAGCAGGCG CGCTCACTGG TGGACGCCGC CGATCTGCCC 
AACCATCCAC TGGATGACAG CTTCCAAACC CTGTTTCTGC AGCGCTGGCG TATCAGCCTG 
ACGCTGCAAG CCACCATGAT GCATCACCAA TTGCTGGAAC AGGAACGCGA ACAGCTGATG 
GCGGAGCTGC AGGAACGTCT GGCGCTGAGT GGCGCCCTGG AGCCGCTGCT GTCGGAAAAC 
GACACCGCTG CCGGGCGGCT GTGGGATATG AGTAAAGGCC ATCTGCAACG GGGTGATTAT 
CAACGGCTGG TGGAATACGG CAATTTCTTG CAGCAGCAAC CGGAACTGAA AAAGCTGGCA 
CAGCAGCTTG GGCGCAGCTA TCAGGCCAAG GCGGTGCAAC AGCAGGACGC GTTGCCGGAG 
CCTTTCCGCG TGATGGTGCA GGTGCCGGCC ACGCTACCGG AAGAGGTCAG CGGCATTCAC 
CAGAGCGACG ATATTCTGCG CCTGCTGCCG CCCGAGTTGG TCACGCTGGG CATTGAAGAG 
CTGGAGTTTG AGTTTTACCG CCGCCTGCTG GAAAAACGGC TTTTGAGCTA TCGTCTGCAG 
GGCGATGTCT GGCAGGAACA GATCCATATC CGTCAGGTCA CTCACCAGCA GCAGGATCAA 
CAACCTCGCG GGCCGTTTAT TGTCTGCGTG GATACCTCAG GTTCGATGGG CGGTTTCAAC 
GAGCAGTGCG CCAAGGCTTT CTGTCTGGCG CTGTTGCGCA TTGCGCTGGC GGATAATCGC 
CGCTGCTACA TCATGCTGTT CGCCAACCAG ATAGTGCATT ACGAACTGAC CGCCGCCAGC 
GGTATTGAGC AGGCGGTTCG CTTTCTCGGT CAGCATTTTC GCGGCGGCAC CGATCTGGCG 
GCCTGCCTGA ATGCCACGGT GAGCAAAATG ACGGAAAGCG GCTGGTTCGA CGCCGACGCG 
GTGATCATTT CTGACTTTAT TGCCCAGCGA TTGCCGGAGG AGATAATAAA GAAGGTTAAA 
CAACAGCAGC AAAACCACCA GCAGCGCTTT CACGCAGTGG CGATGTCCAA CTACGGCAAG 
CCCGGTATCA TGCGTATCTT CGATCATATC TGGCGCTTTG ATACCGGGTT AAAAAGCCGC 
TTAATGCGCC GCTGGCGGCG CTGA

Protein sequence

MLSLETLDLL LAITEGELIE EMIIGMLAAP QLSIFFKKFP AIRRALDRDL PRWKLQLKER 
LHEAMVPPAL AQEFYRYQQC QLENNTQFFH NLNDTLDLLR QLVSPFYEQA RSLVDAADLP 
NHPLDDSFQT LFLQRWRISL TLQATMMHHQ LLEQEREQLM AELQERLALS GALEPLLSEN 
DTAAGRLWDM SKGHLQRGDY QRLVEYGNFL QQQPELKKLA QQLGRSYQAK AVQQQDALPE 
PFRVMVQVPA TLPEEVSGIH QSDDILRLLP PELVTLGIEE LEFEFYRRLL EKRLLSYRLQ 
GDVWQEQIHI RQVTHQQQDQ QPRGPFIVCV DTSGSMGGFN EQCAKAFCLA LLRIALADNR 
RCYIMLFANQ IVHYELTAAS GIEQAVRFLG QHFRGGTDLA ACLNATVSKM TESGWFDADA 
VIISDFIAQR LPEEIIKKVK QQQQNHQQRF HAVAMSNYGK PGIMRIFDHI WRFDTGLKSR 
LMRRWRR