Gene Nmul_A0966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0966
Symbol
ID	3785757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1122503
End bp	1123741
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	58%
IMG OID	637811049
Product	major facilitator transporter
Protein accession	YP_411661
Protein GI	82702095
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.582345
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCTAAAT CACTATTTGC AGGCATCTGG TTCAGGATTG TCCTGGTATT TGCCATGGCC 
CTGCCGATGC TTGTCTTGTA TGCCATCAGC ACGCTTGGAC CATTCCTCGT GCGCGATCTG 
CGCTTCGAGC CCGGACTGCC GGGTTATCTC GTGATGAGTG CATTCGGCAT CGCGGCCATT 
CTATCGCTCT GGTCAGGCGC GTTCGTCGAC CGGATCGGGA CACGCCGAGC GCTGGCAGTG 
CTCTTCTTCG CCGTAGCGCT TGCTTTTGCG CTGATTGCAA CGGTTGAAGA TTATTACTCC 
CTGGTTGCAG CGGCTGCCAT TTGCGGAATC GCCCAGGCGC TGGCAAACCC GGTCACCAAT 
TTACTGATCG CGCAGCATGT TTCACCGGAG AAAAAGGCGA CAGTCGTAGG ATTCAAGCAA 
TCCGGCGTTC AGCTTGCGGC GCTTTTTGCA GGTCTCATTC TTCCCGCCAT CGCAACGCAA 
TACGGGTGGC ATGCCGCATT CGGCATCGTT GTTCCGGTAG CGATACTGTT CGGAATTACG 
ACACCCTTCA TCGCTCCGCG GAAACCCTCG GAAACGCGTA AAGCTTTCAC TGTCCCCCTG 
CCAAATGTAC TGCTGCTGCG TTTGATGGCC ATCCAGTTTT GCGTGGGTAT AGCACTCTCC 
GCCTTCGTTA CGTTCCTGCC GACCTTTGCC GTCCGCCAAG GGATGGCGCT GTCGGTGGCG 
GGAAGCTTGA TCGCCGTCTT CGGCGTGATG GGGATACTCT CGCGGATAAC ATTGACACCC 
CTCGGTGCCA GAATGAAAGA CGAATCGCTG CTTCTGATTG TGCTCATCGC CATTGCAGCT 
TGCGCAATCG CGGTGACGAT GAGGGCCAAT GCGGACAGTC ATTGGCCCCT CTGGGCAGGA 
GCTGTGGGAA TGGGCCTCAC CGCCGTCGGC ACCAATGCAA TCGCAATGAG CATGTTGATC 
AGGGATGCCA CATTTGGCCC GATAGCAACG GCATCCGGTT TTGTTTCAGT CGCTTTCTTC 
AGCGGGTTCG CATCCGGCCC GCCCCTTTAT AGCGAGTTTT CGAATTATTC CGGCAACTCC 
CAGTCTTCCT GGGGCTTGTT GATCGGCGTG CTCTTGTGCG GGTGCCTGAC GGCCCTGGGA 
CTGGCTTCTG CCCGACGGCG CAAGGCGCAA ACACCGGCGC CAACTGGCGC GGTTCAGCGC 
GCGACTACCG CAAAGGTGCA AGAACCTGTG AAGCCATGA

Protein sequence

MAKSLFAGIW FRIVLVFAMA LPMLVLYAIS TLGPFLVRDL RFEPGLPGYL VMSAFGIAAI 
LSLWSGAFVD RIGTRRALAV LFFAVALAFA LIATVEDYYS LVAAAAICGI AQALANPVTN 
LLIAQHVSPE KKATVVGFKQ SGVQLAALFA GLILPAIATQ YGWHAAFGIV VPVAILFGIT 
TPFIAPRKPS ETRKAFTVPL PNVLLLRLMA IQFCVGIALS AFVTFLPTFA VRQGMALSVA 
GSLIAVFGVM GILSRITLTP LGARMKDESL LLIVLIAIAA CAIAVTMRAN ADSHWPLWAG 
AVGMGLTAVG TNAIAMSMLI RDATFGPIAT ASGFVSVAFF SGFASGPPLY SEFSNYSGNS 
QSSWGLLIGV LLCGCLTALG LASARRRKAQ TPAPTGAVQR ATTAKVQEPV KP