Gene EcolC_3962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3962
Symbol
ID	6064489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4352222
End bp	4353871
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	56%
IMG OID	641603375
Product	Na+/H+ antiporter
Protein accession	YP_001726890
Protein GI	170021936
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0025] NhaP-type Na+/H+ and K+/H+ antiporters
TIGRFAM ID	[TIGR00831] Na+/H+ antiporter, bacterial form

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00930832
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGAAATCT TCTTCACCAT ACTGATAATG ACCCTCGTGG TCTCGCTGTC CGGGGTGGTC 
ACTCGTGTCA TGCCCTTTCA GATCCCGCTT CCGCTTATGC AAATCGCCAT CGGTGCGCTA 
CTGGCGTGGC CGACGTTTGG TTTGCATGTG GAGTTTGATC CTGAACTCTT TTTAGTCTTG 
TTTATCCCGC CGTTGCTGTT CGCTGATGGC TGGAAAACGC CGACCCGTGA ATTTCTTGAA 
CATGGTCGAG AGATTTTCGG CCTCGCACTG GCGCTGGTGG TGGTCACCGT GGTCGGCATT 
GGCTTCCTTA TTTACTGGGT GGTGCCGGGC ATTCCGCTGA TCCCCGCCTT TGCGCTGGCG 
GCGGTGCTTT CTCCGACCGA TGCTGTGGCG CTCTCCGGGA TTGTTGGCGA AGGGCGCATC 
CCGAAAAAAA TCATGGGCAT TTTGCAGGGC GAAGCGTTGA TGAATGACGC CTCCGGCCTG 
GTGTCGTTGA AGTTTGCCGT GGCAGTGGCG ATGGGGACGA TGATCTTCAC CGTTGGCGGT 
GCAACGGTCG AATTTATGAA AGTAGCCATT GGCGGTATTC TCGCTGGTTT TGTGGTGAGC 
TGGCTGTATG GTCGCTCGCT GCGATTCCTC AGCCGCTGGG GCGGTGATGA ACCCGCGACG 
CAGATCGTTC TGCTGTTCTT GCTGCCATTC GCTTCTTATC TGATTGCCGA ACATATTGGC 
GTTTCGGGCA TCCTCGCTGC GGTTGCCGCC GGGATGACCA TCACCCGCTC CGGTGTGATG 
CGCCGTGCGC CGCTGGCAAT GCGCCTGCGT GCAAACAGCA CCTGGGCGAT GCTGGAATTT 
GTCTTTAACG GCATGGTGTT CCTGCTGTTA GGTCTGCAGC TGCCGGGTAT TCTGGAGACG 
TCGCTGATGG CGGCAGAAAT CGACCCTAAC GTCGAAATCT GGATGCTGTT TACCGATATT 
ATTCTGATAT ATGCGGCGCT GATGCTGGTC CGTTTCGGCT GGCTGTGGAC GATGAAAAAG 
TTCAGCAACC GCTTCCTGAA GAAGAAGCCG ATGGAGTTTG GTTCGTGGAC CACACGAGAA 
ATCCTGATCG CGTCTTTCGC CGGGGTGCGT GGGGCGATCA CTCTGGCCGG TGTGCTCTCT 
ATCCCGCTGC TCTTGCCGGA TGGTAACGTC TTCCCGGCGC GCTATGAGCT GGTGTTCCTG 
GCGGCTGGCG TCATTCTCTT CTCGCTGTTT GTCGGCGTGG TGATGTTGCC TATTCTGCTA 
CAACACATTG AAGTCGCGGA CCATTCGCAA CAATTGAAAG AGGAACGTAT TGCGCGAGCG 
GCAACGGCAG AAGTGGCGAT TGTGGCGATC CAGAAAATGG AGGAGCGTCT GGCGGCGGAT 
ACCGAAGAGA ATATCGATAA CCAGCTGCTT ACGGAGGTCA GTTCTCGCGT CATTGGTAAC 
CTGCGTCGTC GCGCCGATGG ACGTAACGAC GTTGAAAGTT CCGTGCAGGA AGAGAACCTT 
GAGCGTCGCT TCCGTCTGGC GGCATTGCGT TCTGAACGTG CTGAACTTTA CCACCTGCGC 
GCCACGCGGG AGATCAGCAA CGAAACGCTG CAAAAATTAC TGCACGATCT CGATTTGCTT 
GAAGCGTTGC TAATTGAGGA AAATCAGTAA

Protein sequence

MEIFFTILIM TLVVSLSGVV TRVMPFQIPL PLMQIAIGAL LAWPTFGLHV EFDPELFLVL 
FIPPLLFADG WKTPTREFLE HGREIFGLAL ALVVVTVVGI GFLIYWVVPG IPLIPAFALA 
AVLSPTDAVA LSGIVGEGRI PKKIMGILQG EALMNDASGL VSLKFAVAVA MGTMIFTVGG 
ATVEFMKVAI GGILAGFVVS WLYGRSLRFL SRWGGDEPAT QIVLLFLLPF ASYLIAEHIG 
VSGILAAVAA GMTITRSGVM RRAPLAMRLR ANSTWAMLEF VFNGMVFLLL GLQLPGILET 
SLMAAEIDPN VEIWMLFTDI ILIYAALMLV RFGWLWTMKK FSNRFLKKKP MEFGSWTTRE 
ILIASFAGVR GAITLAGVLS IPLLLPDGNV FPARYELVFL AAGVILFSLF VGVVMLPILL 
QHIEVADHSQ QLKEERIARA ATAEVAIVAI QKMEERLAAD TEENIDNQLL TEVSSRVIGN 
LRRRADGRND VESSVQEENL ERRFRLAALR SERAELYHLR ATREISNETL QKLLHDLDLL 
EALLIEENQ