Gene Mnod_4043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_4043
Symbol
ID	7303420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	-
Start bp	4112899
End bp	4114020
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	62%
IMG OID	643601695
Product	transcriptional regulator, LacI family
Protein accession	YP_002499225
Protein GI	220923923
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCGCC CTACCATCGC CGATGTGGCC AAGGCCGCCA ATGTCAGCGT GTCAACGGTC 
GATCGTGTCC TGAGCGGCCG CCATTCCGTG CGGGAGGCAA CCGCCGAACG GGTGCAACGT 
GCCGCGGAGG CCGTCGGCTT TCATCTCGCT GGGACGATCC GTCACCGCCT CGGACAGGAT 
CGGCCTGCCC GCACCCTCGG CTTCCTCCTC CAGCAGCGGC AAAACGAGTT TTACGAGACA 
CTCGGGCAGG TCCTGCAGGA GGCAACGGAT GCCTCGACGA CCATCAGGGG CCAGGCGGTG 
GTGAGGTTCC GGGACTACCA GGAGGAGGAG GTCGCCGCGG AATGCCTCCT CCAGCTTGGG 
CGGGAATGCA ATGCCGTGGC GGTCGTCGCC GCAGATCACC CCAAGGTGAC GCAGGCGATC 
GACACTCTGC ACGAGGAAGG CGTGCCTGTA TTCGCGCTCA TTTCCGAGCT CACGGCGGCG 
AACAGTGCCG GCTACGTAGG GCTGGACAAC TGGCAGGTCG GCGGCACCGC GGCTTGGTTC 
CTCTCCAACA TGTGCAGGAC ACCGGGAAAG ATCGGCATCT GTGTGGGGAG CCTTTGCTTC 
CAACGTGCCA GCGAAATGCG CTTCCGTTCG TACTTCCGCG AACGTGCACC AGAGTTTCAG 
TTACTCGATT CCACGGTGAC CCTCGACGAC GAGCGCTACG CCTATGAATG CACCCGGGAT 
TTGTTGCGGC AGACGCCGGA TCTGGTTGGC ATTTACGTCG CCGGTGGCAG CATCACCGGC 
GTCATCCGAG CCTTGCGTGA ACTCCCGAGC GCCGCATCCC GAAACCTCGT GGTTATCGGA 
CGGGAACTGA TACCTGATAC CATGAGAGGG CTCATCGAGG GTTTGATCAA TGTTGTCCTG 
TCGCATCCGA AGAAATTGCT GGCCGAGACG CTGGTCGAGG CGATGGCGCA GTCAACGATC 
AGCAACCAAG GCGGCAGCTA CGTGCACCCT CCCATTCCCT TCGATATCTA CGCGCCCGAA 
AATCTTTGGG CATTTCGATT ATCTGACTTG CGGGGAATGT ATGAGCCGGG GTGGCCATGG 
CGGCCGAACA TAGCACGGAG CCGGAAATTG AGTGGCGTGT GA

Protein sequence

MPRPTIADVA KAANVSVSTV DRVLSGRHSV REATAERVQR AAEAVGFHLA GTIRHRLGQD 
RPARTLGFLL QQRQNEFYET LGQVLQEATD ASTTIRGQAV VRFRDYQEEE VAAECLLQLG 
RECNAVAVVA ADHPKVTQAI DTLHEEGVPV FALISELTAA NSAGYVGLDN WQVGGTAAWF 
LSNMCRTPGK IGICVGSLCF QRASEMRFRS YFRERAPEFQ LLDSTVTLDD ERYAYECTRD 
LLRQTPDLVG IYVAGGSITG VIRALRELPS AASRNLVVIG RELIPDTMRG LIEGLINVVL 
SHPKKLLAET LVEAMAQSTI SNQGGSYVHP PIPFDIYAPE NLWAFRLSDL RGMYEPGWPW 
RPNIARSRKL SGV