Gene EcSMS35_2541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2541
Symbol
ID	6146142
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2600437
End bp	2601693
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	54%
IMG OID	641617413
Product	hypothetical protein
Protein accession	YP_001744584
Protein GI	170682632
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0038] Chloride channel protein EriC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.25776
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCCATC CGCGAGCCAG AACCATGTTG TTATTATCGC TCCCCGCCGT GGCAATTGGG 
ATTGCGTCCA GTCTTATTCT GATTGTGGTG ATGAAAATCG CCTCGGTATT ACAGAATTTG 
CTCTGGCTAC GACTGCCGGG AACTCTGGGG ATAGCCCAGG ATTCACCTTT CTGGATCATC 
GCCATATTAA CGCTAACAGG TATTGCGGTG GGGTTGGTTA TCCGTTTCAG CCAGGGGCAT 
GCTGGACCAG ACCCCGCCTG TGAACCGCTG ATCGGCGCGC CGGTTCCGCC CTCTGCGCTA 
CCAGGACTTA TCGTAGCATT AATTCTCGGT CTTGCTGGCG GCGTCAGCCT GGGGCCGGAA 
CATCCGATCA TGACCGTCAA TATCGCCCTT GCGGTTGCGA TAGGTGCTCG TCTGTTACCG 
CGCGTCAATC GGATGGAGTG GACTATTTTA GCCTCTGCCG GAACCATCGG CGCGCTGTTT 
GGCACACCTG TTGCGGCGGC GTTGATATTT TCGCAAACCT TAAATGGCAG TAGTGAAGTC 
CCGCTATGGG ATCGTCTCTT TGCGCCGTTA ATGGCGGCGG CGGCTGGTGC GCTAACCACC 
GGATTGTTTT TCCATCCTCA TTTTTCACTG CCCATTGCGC ATTATGGGCA GATGGAGATG 
ACCGATATTC TCAGCGGTGC AATTGTGGCG GCGATTGCCA TCGCAGCAGG GATGGTTGCC 
GTATGGTGTC TGCCACGGTT GCACGCGATG ATGCATCAGA TTAAAAATCC GGTGCTAATG 
CTGGGAGTGG GCGGATTTAT TCTCGGTATT CTGGGGGTTA TTGCTGGACC AGTTTCGCTA 
TTTAAAGGGC TGGATGAGAT GCAGCAGATG GTGGCAAATC AGGCTTTCAG CACCAGCGAT 
TACTTTTTGC TGGCCGTGAT TAAACTTGCC GCTCTCGTGG TTGCTGCCGC CAGCGGCTTT 
CGCGGTGGGC GAATATTCCC GGCAGTGTTT GTCGGGGTGG CATTAGGGTT GATGCTGCAT 
GAGCACGTTC CCGCCGTTCC AGCGGCAATA ACCGTTTCCT GCGCTATTCT CGGCATCGTG 
CTGGTGGTAA CACGCGATGG CTGGTTAAGT CTTTTTATGG CGGCAGTCGT TGTACCCAAT 
ACCACATTGC TACCGCTGCT CTGTATCGTC ATGCTTCCGG CATGGCTGTT ATTAGCAGGT 
AAGCCGATGA TGATGGTCAA TCGTCCGAAG CAACAGCCAC CCCACGATAA CGTTTAG

Protein sequence

MLHPRARTML LLSLPAVAIG IASSLILIVV MKIASVLQNL LWLRLPGTLG IAQDSPFWII 
AILTLTGIAV GLVIRFSQGH AGPDPACEPL IGAPVPPSAL PGLIVALILG LAGGVSLGPE 
HPIMTVNIAL AVAIGARLLP RVNRMEWTIL ASAGTIGALF GTPVAAALIF SQTLNGSSEV 
PLWDRLFAPL MAAAAGALTT GLFFHPHFSL PIAHYGQMEM TDILSGAIVA AIAIAAGMVA 
VWCLPRLHAM MHQIKNPVLM LGVGGFILGI LGVIAGPVSL FKGLDEMQQM VANQAFSTSD 
YFLLAVIKLA ALVVAAASGF RGGRIFPAVF VGVALGLMLH EHVPAVPAAI TVSCAILGIV 
LVVTRDGWLS LFMAAVVVPN TTLLPLLCIV MLPAWLLLAG KPMMMVNRPK QQPPHDNV