Gene Mlg_1007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1007
Symbol
ID	4268375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1146695
End bp	1148203
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	62%
IMG OID	638125758
Product	major facilitator transporter
Protein accession	YP_741850
Protein GI	114320167
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID	[TIGR00886] nitrite extrusion protein (nitrite facilitator)

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0945762
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTCG TTGACGTCTT CAAATTTCGC AGTCCCGAGA TAAAGGCCCT CCACCTCACC 
TGGATTGCGT TCTTCATCAC CTTCTACGTC TGGTTCAACA TGGCCCCGCT GGCCACCAGC 
ATGCTACGCA GCGTGGACTG GTTGACCCAG GATGACATCC GATTATTCGC CATCTGTAAC 
GTCGCCCTCA CCATCCCCGC CCGCATCATC GTCGGCATGG CCTTGGACCG CTTCGGCCCG 
CGCCGGGTGT TCTCGATCCT GATGATCCTG ATGGCCCTGC CGGCGCTGGC GTTCGCCTTC 
GGCAACAACA TGACGCAGCT ACTGATCTCG CGGCTGGTGT TGAGTTCGGT AGGCGCCAGC 
TTCGTGGTGG GCATTCATAT GACCGCGCTC TGGTTCCGGC CCCGGGATAT CGGCTTCGCC 
GAGGGCTTCT ACGCCGGCTG GGGTAACTTC GGTTCGGCCG CGGCCGCGAT GACCCTGCCC 
ACCATCGCCC TCACCCTGTT CGGCGGTGAG GACGGCTGGC GCTGGGCCAT GGCGGTGAGT 
GCCCTGGTCA TGGCCGGTTA CGGGGTCTTC TACTGGTTCG CCATCACCGA CGGCCCGCAC 
GCCACCTCAC ACAAGCGCAC CCGTAACGCC ATGGCCATGG AGGTCAGCAG TTGGGGCGAC 
ATGATCAAGC TGATCATCTG CACCCTTCCC CTGGTGGGCG TCCTTGCTCT CCTGGTGTGG 
CGCATCGAAC AGATGGGCTA CCTCAGCACT ACCGGTGCCA CCATCCTGTA CCTGGTCATC 
GGCGGCATCG TGCTCTACCA GGTCGTCCAG ATCTTCCGGG TCAATGTCCC GATCCTGAAA 
AAAGGCGTGC CCAAGGACGA CAAGTACCAC TTCAACAGCG TCATCGCGCT GAACAGTACC 
TACTTCGCCA ACTTCGGGGC GGAACTGGCG GTGGTCTCCA TGCTGCCGAT GTTCTTCGAG 
CAGACCTGGG GGCTGGGTGC CGCCGCCGCG GGCGCCATCG CCGCCTCCTT TGCGTTCGTC 
AACCTCGTCG CACGCCCCAT GGGCGGCCTG GTCTCCGATC GCATGGGCAA CCGGCGCTTC 
GTGATGCTGT GCTACATGTT CGGGATTGGT ATCGGCTTCG TGCTCATGGG CCTGTTGGAC 
TCCAACTGGC CACTGATCGT TGCCATCGCC ATCACGATCT TCACCTCCTT CTTCGTACAG 
GGCTCAGAGG GGGCGACCTT CGGGATCATC CCGTCGATCA AGCGCCGGAT CACCGGCCAG 
ATCTCGGGCA TGGCGGGGGC GTACGGCAAT GTGGGTGCGG TGGTCTACCT GACCATCTTC 
ACCTTCGTCA CCCCGACCCA GTTCTTCTTC ATCATCGCCA CCGGCGCGTT CCTGAGCTGG 
CTGATCTGCC TGCTCCTGCT GAAGGAGCCG GAAGGCGCCT TTGCCGAGGA CTACCACGTC 
TCATCGGTGG ACCGCATGAT CGAGGAAGAG GACCTGAAAC GGGAGCGCCA GAAGGCCTGG 
GCGCGATAA

Protein sequence

MKVVDVFKFR SPEIKALHLT WIAFFITFYV WFNMAPLATS MLRSVDWLTQ DDIRLFAICN 
VALTIPARII VGMALDRFGP RRVFSILMIL MALPALAFAF GNNMTQLLIS RLVLSSVGAS 
FVVGIHMTAL WFRPRDIGFA EGFYAGWGNF GSAAAAMTLP TIALTLFGGE DGWRWAMAVS 
ALVMAGYGVF YWFAITDGPH ATSHKRTRNA MAMEVSSWGD MIKLIICTLP LVGVLALLVW 
RIEQMGYLST TGATILYLVI GGIVLYQVVQ IFRVNVPILK KGVPKDDKYH FNSVIALNST 
YFANFGAELA VVSMLPMFFE QTWGLGAAAA GAIAASFAFV NLVARPMGGL VSDRMGNRRF 
VMLCYMFGIG IGFVLMGLLD SNWPLIVAIA ITIFTSFFVQ GSEGATFGII PSIKRRITGQ 
ISGMAGAYGN VGAVVYLTIF TFVTPTQFFF IIATGAFLSW LICLLLLKEP EGAFAEDYHV 
SSVDRMIEEE DLKRERQKAW AR