Gene Spro_4678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_4678
Symbol
ID	5606520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	5168690
End bp	5170324
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	59%
IMG OID	640940244
Product	O-antigen polymerase
Protein accession	YP_001480899
Protein GI	157372910
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATATCCA AATCCAAAAC AGCCTGGTTA TTCGGGCTGG CGGCGTTTTA TTGCCTGATT 
GCCATGCATA TTTACTGGCC CAATCGCGGC GGCAGCGGTT TTTATCTGCC GTGGAATCTG 
GTTGGTGGGA TATTTATCGC CCTGACGATC CTCGGCACCC TGCTGTTTTG CCGACCGCCG 
CTGGCGGTCT CCGGCTTTTT TAACCGGCTG GCGCTGGGGG GCCTGATTTT ATTTTTACCG 
CTGCTGTGGG CGCAACAACC CTGGCTAAGC GAAGCCCTAC CGCGCCTGAT GGGTCTGGCA 
CTGGGCATCA TGGCCTACTT CGCACTGCTG CAGATCCCGC TCAGCCGCCA AGGGCGGCGC 
AGGCTGCTGA CTCTGTTATT GGCGGCAACG GTGATCGAAG CCCTGTTCGG CCTGGTGCAA 
TACAGCCTGC TGCAGCCGGG TAACTGGATC GGCTATAACA GCCTGAAAAA CCGCCCTTAC 
GGCATCTTCC AGCAGTGGAA CCTGATGGCC AGCTTTATGG CGACCGGTCT GGCGCTGGCG 
CTGTATTTGC TCAGCAGTCG TCGCCCCTTG TCGCGTAGCC TGCAATGGTT GAGCGCCACC 
ATGTTGGTAC TGGCACCGCT GTTGCTGGTG GTTATTGCTT CGCGCGTCGG GCTGCTGGCT 
GCTCTGCTGC TGTCACCACT GCAACTGTGG ATGCTATATC GCCTTAATCG CCGCCGCGCC 
ACCCTCTCCC TGTTGCTACT GCTAGCCGGG GTAGCCGCCG GGGTACTGTT GGTGCTGCTC 
AACGGTGCGA CACGGGCGGT CACAGTGACA GAACCGATTT TCTACCGGTT GGCTTACTGG 
CAAGAAGCAC TGCGCATGAT CGCCGAACGC CCGTGGTTTG GCTGGGGTTA CGGCCATTTT 
CAGCACGATT TCCTGCATCA TTTCTACACC ACCCATAGCA GTGGAATGGA AAGCGTCGCC 
ATCAGCCACC CACACAACGA AATTTTGCTG TGGGGCATCG AAGGTGGCCT GCTCGGCCTG 
AGCGGCATTG TCATGGTCGG TTGGGGATTA TGGTGTTTGC TGCGGCGCAC TCGAGTACTG 
CCACTGCGCC CTGCCCCCTG GATGGCTGCG CTGCCAATCT TGTTGCATAT GATGGTGGAG 
TACCCACTTT ATCTTTCCGC CGCCCACGCC GTGCTGCTGC TGGCAATCTT GCGCGCGGGT 
GACGTACGCC GCCGCTGGCG GTTACCTCGC TGGCCGCAAC AGACACTGCG TCTGCTTATC 
GGTGCCGCTG CCTTACTGAT CCTGCCCTAT CTGTTCAACG GCCTGCACAG CGCACTGATC 
GTTACCGCAG TGGAGAAGAG CGGCCTGCGG CAGTTTGGCC CCATGAGCCG GGTGATAACG 
CCGACGCCCT GGCAGGTACG TTATGACTAC GACGTCCAGT TGCAGCGGCT GCTGCAATAT 
CCGCAAACCC GCGATACCGC CACGCTGTTG AGCTACCGGC AGTGGGCAGA AAACGAAATC 
CGCGTGCGGC CGGACGCCAA TATCTACATC AATCTGGTAG CGGTCAGCCG CTTACTGCAA 
CAGCCCCAGC GGGCCGCCGA ACTGCGACAT CAGGCTCGTC GACTGTTCCC GCACGATATG 
CGTTTTGAGG AGTAA

Protein sequence

MISKSKTAWL FGLAAFYCLI AMHIYWPNRG GSGFYLPWNL VGGIFIALTI LGTLLFCRPP 
LAVSGFFNRL ALGGLILFLP LLWAQQPWLS EALPRLMGLA LGIMAYFALL QIPLSRQGRR 
RLLTLLLAAT VIEALFGLVQ YSLLQPGNWI GYNSLKNRPY GIFQQWNLMA SFMATGLALA 
LYLLSSRRPL SRSLQWLSAT MLVLAPLLLV VIASRVGLLA ALLLSPLQLW MLYRLNRRRA 
TLSLLLLLAG VAAGVLLVLL NGATRAVTVT EPIFYRLAYW QEALRMIAER PWFGWGYGHF 
QHDFLHHFYT THSSGMESVA ISHPHNEILL WGIEGGLLGL SGIVMVGWGL WCLLRRTRVL 
PLRPAPWMAA LPILLHMMVE YPLYLSAAHA VLLLAILRAG DVRRRWRLPR WPQQTLRLLI 
GAAALLILPY LFNGLHSALI VTAVEKSGLR QFGPMSRVIT PTPWQVRYDY DVQLQRLLQY 
PQTRDTATLL SYRQWAENEI RVRPDANIYI NLVAVSRLLQ QPQRAAELRH QARRLFPHDM 
RFEE