Gene Mlg_2701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2701
Symbol
ID	4269945
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	3063606
End bp	3065441
Gene Length	1836 bp
Protein Length	611 aa
Translation table	11
GC content	64%
IMG OID	638127462
Product	Na+/Pi-cotransporter
Protein accession	YP_743531
Protein GI	114321848
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1283] Na+/phosphate symporter
TIGRFAM ID	[TIGR00704] Na/Pi-cotransporter

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTCC GCGCGGTGGT GCTCGCCATT GTCCTGGGCA TCCTGGCCTG GGGCTTCTGG 
CAGAGTGGAG ATTTCACCGA GATCGCCGCC GGCGTGGCCA TCTTCCTGTT CGGCATGATG 
TCGCTGGAGC AGGGTTTCCG CACCTTTACC GGCGGCACCC TGGAGACCCT GCTCGAGGCT 
TCCACCAATC GGTTGTGGAA GAGCGTGGGC TTCGGCATCG CCAGCACCAC GCTGATGCAG 
TCCAGCACCC TGGTCTCGCT GGTCACCATC TCCTTCGTCA GCGCCCAGAT GATCCCGCTG 
GCCGCGGGCA TCGGCGTGGT GCTGGGGACC AACCTGGGGA CCACCACGGG TGCCTGGCTG 
ATCGCCGGCC TGGGCCTGCG GGTGAACATC TCCGCCTACG CCATGCCGTT ACTGGTCTTC 
GCCATCGTGC TGATGTTCCA GCGCGGTAAG ATGGCCAAGG GGGCGGGCAA TATCCTGCTG 
GGCATCGGCT TTCTCTTCCT GGGTATCCAC TACATGAAGG AGGGCTTCGA CGCCTTCCAG 
GAGACCTTCG ACCTGGCCGC CTACTCCATG GAGGGGATGG CCGGGCTGCT GGTCTACATC 
GGCATCGGCA TGCTCATCAC GGTGATCATG CAGTCCAGCC ACGCCACCTT GCTGGTGGTG 
ATCACCGCCC TGGCGGCCGG GCAGGTCACC TACGAGAACG GCCTGGCCCT GGCCATCGGC 
GCCAACCTGG GGACGGCGGT GACCACGGCC CTGGGTGGCA TGACCGCGCA CCTGGGCGGC 
AAGCGGCTGG CGGTGGCGCA CGTGGTCTTT AATATCGTGA CCGCCGTGGT GGCGGTGGCG 
TTCATGGACT GGATCCGTTT GGGTGTGGAT TTCGGCGGCA ACCTGCTGGG CTTTGCCGAG 
GACGACTTTC TGCTTCGCCT GGCGCTGTTC CATACCCTGT TCAATTTGTT GGGCGTGATG 
ATCTTCGCGC CCTTCACCAA GCAGTTTGCC AGCCTGCTGG AGCACTATGT GACATTCGTC 
TCCAAGCGCA CGGTCAGGCC GCAGTTCCTG CACAAGGACG CGCTGAAGGT GCCGGAGGTC 
ACCGTGGCCG CAGTGCGCAA GGAGGTCTGG CACCTGTACG AGAATGCCTT TTCGCTGATC 
ACCCACGGGC TCAGTCTGCG GCGCACGGTG GTTCGCTCCG AGCAGTCGTT GAGCGACGCT 
GTGGCCCGTA CCCAGCGCAT CATGCCGCTG GATATCGATG ACGATTACGA GCAGCGGATC 
AAGAGCCTGC AGAGCGCCAT CGTGGAATTC ATCAGCGAGA GCGGGACCAG TGGTGATACT 
CCGGCCGCCG CCACCGAGCA GCTCTACGAA CTGCGCCACG CCAGCCAGAA TATTGTGCTG 
GCGGTGAAGG ACATGAAGCA CTTGCACAAG AACCTGTCGC GGCTTGGCCT GTCCCGTAAC 
CGCGCCATCC GCGAGCGCTA CGACGAGATC CGGCTGCTGA TTGCAGGGCT GTTGCGCGAG 
ATTGAGCAAC TGCGCCAGGA GGAACCCGGA GCCTCCACCG TACTCGCGCT TGATGCCTAC 
AAGGTCAGCG TGGAGCGCTT CTACCGGGGG TTCAGCGCCC GGCTGGAGGA GGCGATCAGG 
GAGCGGCGCA TGCGCGGTGC CGAGGCCACC TCGCTGATGA ATGATGCGGG GTACGCCTAT 
GATATTGCCC GTCTGCTTAT CGAGGCGGCG CAGATCTTGC TGGTGGCCAA GGAAAAGGAG 
GTGCGCCTGG CGCAGAGTCA GGTCGCGCTC AGCGATGAAG AGATTCAGGC GGCTGTCGAG 
GAGGTCTCCT CTGAGAGCAA GGGGCGGACG TTGTGA

Protein sequence

MSLRAVVLAI VLGILAWGFW QSGDFTEIAA GVAIFLFGMM SLEQGFRTFT GGTLETLLEA 
STNRLWKSVG FGIASTTLMQ SSTLVSLVTI SFVSAQMIPL AAGIGVVLGT NLGTTTGAWL 
IAGLGLRVNI SAYAMPLLVF AIVLMFQRGK MAKGAGNILL GIGFLFLGIH YMKEGFDAFQ 
ETFDLAAYSM EGMAGLLVYI GIGMLITVIM QSSHATLLVV ITALAAGQVT YENGLALAIG 
ANLGTAVTTA LGGMTAHLGG KRLAVAHVVF NIVTAVVAVA FMDWIRLGVD FGGNLLGFAE 
DDFLLRLALF HTLFNLLGVM IFAPFTKQFA SLLEHYVTFV SKRTVRPQFL HKDALKVPEV 
TVAAVRKEVW HLYENAFSLI THGLSLRRTV VRSEQSLSDA VARTQRIMPL DIDDDYEQRI 
KSLQSAIVEF ISESGTSGDT PAAATEQLYE LRHASQNIVL AVKDMKHLHK NLSRLGLSRN 
RAIRERYDEI RLLIAGLLRE IEQLRQEEPG ASTVLALDAY KVSVERFYRG FSARLEEAIR 
ERRMRGAEAT SLMNDAGYAY DIARLLIEAA QILLVAKEKE VRLAQSQVAL SDEEIQAAVE 
EVSSESKGRT L