Gene Mext_1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1971
Symbol
ID	5831867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	2202775
End bp	2204025
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	70%
IMG OID	641367772
Product	Na+ dependent nucleoside transporter
Protein accession	YP_001639441
Protein GI	163851398
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGACA GGTTGTTCCA TGCCGGCGCG AGCGTTGCCC TGCTGCTCGC CGTGGCGTGG 
CTGTTCTCGG TGAACCGGCG GGCGATCCGG CCACGGGTGG TGCTCGCCGC CCTGGCGCTT 
CAGGTCGGGA TCGGCGCGCT GATGCTGTTC GTACCCGCCG GGCAGAGGGC GCTCGGCGCG 
GTGGCGGATG TCGTCACCAC CGTGCTTTCC TTCGGCGACC GGGGCACCGC CTTCCTGTTC 
GGCGGCCTCG TCGAGCCGCG GATGTTCGAG CTGTTCGGCG GCTCGGGCTT CATCCTGGCC 
CTGCGGGTGC TGCCGCAGAT CCTCTACGTC TCGGCGCTGA TCGGCGTGCT CTACCATCTC 
GGGGTGATGC AGGCGCTGGC CCGGTTTCTC GGCGCGGGTT TGCGAAAACT GCTCGGCACC 
TCGCCGATCG AATCGTTCTC GGCGGTCGTC ACCATCTTCA TCGGGCAGAG CGAGATCGCC 
GTGGCCCTGC GCCCCTTCCT CGCGGCGCTG ACCGGGGCCG AGCTGTTCGC GGTGATGACG 
AGCGGGGCGG CCTCCACCGC CGGCTCGATC CTCGCCGGAT ACGCCGCGCT CGGCGTGCCG 
ATGCCGTATC TTCTCGCCGC CTCGTTCATG GCGATTCCCG GCGGGCTGCT CTACGCCAAG 
ATCCTCGTGC CCTCGACCGA GCCGACGCGC ATCCTCACGA CGCGTGTCGA GTTCGGCGAG 
GCGCGGGCGG CCAACCTGAT CGAGGCCGCC GCCGGCGGCA CGCAGAAGGG CCTCGGCGTC 
GCGGTCTCGG TCGGCGCCAT GCTGATCGCC TTCGTCGGGC TGATCGCGCT CGTGAACGCC 
GGCATCGGCT GGGCCGGCGG CGTGTTCGGG TTCGCCGGCC TCTCGATCGA GGGCATTCTC 
GGCGTCGTGC TGGCGCCGCT GGCCTGGCTC TTGGGCGTGC CATGGGAGCA GGCGACCCTC 
GTCGGCGGCG CCATCGGCCA GAAGATCGCC TTCAACGAGT TCCTGGCCTA TGCCAGCCTC 
TCGCCGATTC TGAAGGCCGG CACCCTCGAC CCGCGCACGA GCGCGATCCT GTGCTTCGCG 
CTCTGCGGCT TCGCCAACCT CGCCTCGGTG GCGATTCAGC TCGCGAGCTT CACCAGTCTC 
GCCCCCGAGC GCCGGCCCGA GATCGCCCGG TTCGGCCTGC GCGCGATCCT GGCGGGCACG 
CTCTCGAACC TCACCAGCGC GGCCATCGCC GGATTGTTCA TCACCGGGTA A

Protein sequence

MLDRLFHAGA SVALLLAVAW LFSVNRRAIR PRVVLAALAL QVGIGALMLF VPAGQRALGA 
VADVVTTVLS FGDRGTAFLF GGLVEPRMFE LFGGSGFILA LRVLPQILYV SALIGVLYHL 
GVMQALARFL GAGLRKLLGT SPIESFSAVV TIFIGQSEIA VALRPFLAAL TGAELFAVMT 
SGAASTAGSI LAGYAALGVP MPYLLAASFM AIPGGLLYAK ILVPSTEPTR ILTTRVEFGE 
ARAANLIEAA AGGTQKGLGV AVSVGAMLIA FVGLIALVNA GIGWAGGVFG FAGLSIEGIL 
GVVLAPLAWL LGVPWEQATL VGGAIGQKIA FNEFLAYASL SPILKAGTLD PRTSAILCFA 
LCGFANLASV AIQLASFTSL APERRPEIAR FGLRAILAGT LSNLTSAAIA GLFITG