Gene SeAg_B2040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B2040
Symbol	mdoC
ID	6796101
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	1977972
End bp	1979126
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	46%
IMG OID	642776264
Product	glucans biosynthesis protein
Protein accession	YP_002146895
Protein GI	197247793
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00000145807
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTCTG TACCCGCGCC GCGTGAATAT TTTCTTGACT CTATCCGCGC ATGGCTGATG 
TTGTTAGGGA TTCCCTTTCA TATCTCGTTG ATCTATTCCA CTCACAGTTG GCATGTCAAT 
AGCGCCACGC CATCATGGTG GCTAACCCTG TTTAACGATT TTATCCACGC TTTTCGTATG 
CAGGTGTTTT TTGTTATTTC TGGTTATTTT TCGTACATGT TGTTTTTACG TTATCCGTTA 
AAACGCTGGT GGAAAGTACG GGTAGAACGT GTGGGTATTC CTATGCTTAC CGCAATCCCT 
TTGCTTACCT TGCCGCAATT TATCCTGTTG CAATATGTCA AAGAGAAAAC AGAGAACTGG 
CCTACACTCT CTGCCTATGA AAAATATAAT ACGTTAGCGT GGGAACTCAT TTCACATCTG 
TGGTTTTTAC TGGTGCTGGT GATATTAACC ACAGTCAGCA TCGGGATTTT TACCTGGTTC 
CAAAAAAGGC AGGAAACAAG CAAGCCTCGT CCCGCCGCTA TTTCACTAGC CAGGCTTTCG 
CTTATTTTTT TCCTGCTGGG GATGGCTTAC GCCGCTATCA GGCGCATTAT TTTCATCGTA 
TATCCGGCAA TCCTCAGTGA CGGCATGTTC AATTTTATTG TGATGCAAAC GCTATTTTAT 
GTGCCGTTTT TTATTCTCGG CGCGTTGGCC TTCATTCACC CCGATCTGAA AGCGCGCTTC 
ACCACGCCCT CACGCGGATG CACTTTAGGC GCTGCCGTTG CTTTTATCGC CTATCTGCTG 
AATCAACGTT ATGGGAGCGG CGACGCCTGG ATGTACGAAA CCGAATCCGT GATTACGATG 
GTCATGGGGC TGTGGATGGT GAACGTAGTA TTTTCACTGG GGCATCGCTT GTTAAACTTC 
CAGTCCGCGC GCGTCACCTA TTTCGTGAAT GCTTCGCTGT TTATTTATCT GGTGCATCAT 
CCCTTAACGC TTTTCTTTGG CGCGTATATT ACGCCGCATA TCTCCTCCAA CCTGATCGGG 
TTCTTGTGCG GGCTGATATT TGTTATGGGT ATTGCGTTAA TTCTGTATGA AATTCATTTA 
CGCATCCCGC TTCTGAAATT TCTCTTTTCA GGTAAACCGC CGGTAAAACA AGAAAGCCGC 
GCCGCGATCG GGTAG

Protein sequence

MSSVPAPREY FLDSIRAWLM LLGIPFHISL IYSTHSWHVN SATPSWWLTL FNDFIHAFRM 
QVFFVISGYF SYMLFLRYPL KRWWKVRVER VGIPMLTAIP LLTLPQFILL QYVKEKTENW 
PTLSAYEKYN TLAWELISHL WFLLVLVILT TVSIGIFTWF QKRQETSKPR PAAISLARLS 
LIFFLLGMAY AAIRRIIFIV YPAILSDGMF NFIVMQTLFY VPFFILGALA FIHPDLKARF 
TTPSRGCTLG AAVAFIAYLL NQRYGSGDAW MYETESVITM VMGLWMVNVV FSLGHRLLNF 
QSARVTYFVN ASLFIYLVHH PLTLFFGAYI TPHISSNLIG FLCGLIFVMG IALILYEIHL 
RIPLLKFLFS GKPPVKQESR AAIG