Gene EcSMS35_2060 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2060
Symbol	mviN
ID	6142791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2077920
End bp	2079455
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	53%
IMG OID	641616936
Product	integral membrane protein MviN
Protein accession	YP_001744112
Protein GI	170684055
COG category	[R] General function prediction only
COG ID	[COG0728] Uncharacterized membrane protein, putative virulence factor
TIGRFAM ID	[TIGR01695] integral membrane protein MviN

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.178549
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTTAT TAAAATCGCT GGCCGCCGTC AGCTCGATGA CCATGTTTTC GCGTGTGCTT 
GGCTTCGCAC GTGACGCAAT TGTCGCCAGA ATCTTTGGCG CAGGGATGGC AACCGACGCC 
TTTTTCGTCG CTTTTAAACT TCCTAACTTG TTGCGCCGTA TTTTTGCCGA AGGGGCATTT 
TCCCAGGCAT TTGTACCGAT TCTGGCGGAA TATAAAAGCA AGCAGGGTGA AGACGCCACG 
CGGGTCTTTG TCTCTTATGT TTCTGGCCTG CTGACACTTG CGCTGGCGGT TGTGACGGTC 
GCTGGCATGC TCGCTGCACC GTGGGTGATC ATGGTGACCG CGCCTGGCTT CGCTGACACT 
GCCGACAAAT TTGCCCTGAC CAGCCAGCTA CTAAAGATAA CCTTTCCCTA TATCTTGCTG 
ATCTCCCTGG CGTCGCTGGT GGGAGCGATT CTGAATACCT GGAACCGCTT CTCAATTCCG 
GCGTTTGCCC CGACATTGCT CAATATCAGC ATGATTGGCT TTGCGCTGTT TGCCGCACCG 
TACTTTAATC CACCGGTGCT GGCGCTGGCC TGGGCTGTTA CGGTCGGCGG CATCCTGCAG 
CTGGTGTATC AGCTACCGCA TCTGAAGAAG ATCGGCATGC TGGTTTTGCC ACGCATTAAC 
TTCCACGATG CCGGAGCAAT GCGCGTGGTG AAACAGATGG GACCGGCGAT CCTTGGCGTC 
TCTGTGAGCC AGATCTCCTT AATCATCAAC ACCATTTTTG CCTCGTTTCT TGCTTCCGGT 
TCGGTGTCTT GGATGTATTA CGCCGACCGC TTAATGGAGT TTCCGTCCGG TGTACTGGGC 
GTGGCGCTTG GCACCATTTT GCTGCCGTCG CTGTCGAAAA GTTTTGCCAG TGGCAATCAT 
GATGAATACA ACCGTTTGAT GGACTGGGGG CTGCGTCTTT GTTTCCTGTT GGCGCTGCCG 
AGTGCGGTTG CGTTGGGCAT TCTTTCCGGT CCGTTAACCG TTTCGCTGTT CCAGTACGGT 
AAATTTACCG CCTTTGATGC GCTGATGACC CAGCGGGCGT TAATTGCCTA CTCGGTGGGT 
TTGATTGGCC TGATTGTAGT GAAAGTGTTG GCTCCTGGCT TTTATTCCCG CCAGGACATT 
AAAACGCCAG TGAAAATTGC CATCGTTACG CTGATTTTAA CGCAATTGAT GAACCTGGCG 
TTTATCGGTC CGTTGAAACA TGCCGGGCTG TCACTTTCTA TTGGTCTGGC GGCGTGTCTG 
AATGCTTCGC TGCTTTACTG GCAGTTGCGT AAGCAGAAAA TCTTTACCCC GCAACCTGGC 
TGGATGGCGT TTCTGTTGCG TCTGGTAGTG GCGGTACTGG TGATGTCGGG CGTGCTTTTA 
GGTATGTTAC ATATCATGCC GGAGTGGTCA TTGGGTACCA TGCCCTGGCG CTTACTGCGT 
TTAATGGCGG TCGTGCTGGC GGGGATTGCC GCGTACTTCG CTGCACTGGC GGTACTGGGC 
TTCAAAGTTA AAGAATTTGC CCGCCGGACG GTGTAA

Protein sequence

MNLLKSLAAV SSMTMFSRVL GFARDAIVAR IFGAGMATDA FFVAFKLPNL LRRIFAEGAF 
SQAFVPILAE YKSKQGEDAT RVFVSYVSGL LTLALAVVTV AGMLAAPWVI MVTAPGFADT 
ADKFALTSQL LKITFPYILL ISLASLVGAI LNTWNRFSIP AFAPTLLNIS MIGFALFAAP 
YFNPPVLALA WAVTVGGILQ LVYQLPHLKK IGMLVLPRIN FHDAGAMRVV KQMGPAILGV 
SVSQISLIIN TIFASFLASG SVSWMYYADR LMEFPSGVLG VALGTILLPS LSKSFASGNH 
DEYNRLMDWG LRLCFLLALP SAVALGILSG PLTVSLFQYG KFTAFDALMT QRALIAYSVG 
LIGLIVVKVL APGFYSRQDI KTPVKIAIVT LILTQLMNLA FIGPLKHAGL SLSIGLAACL 
NASLLYWQLR KQKIFTPQPG WMAFLLRLVV AVLVMSGVLL GMLHIMPEWS LGTMPWRLLR 
LMAVVLAGIA AYFAALAVLG FKVKEFARRT V