Gene Mchl_4960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_4960
Symbol
ID	7114957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	5295787
End bp	5296803
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	74%
IMG OID	643527653
Product	putative nitrate transport protein
Protein accession	YP_002423653
Protein GI	218532837
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.0294362
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGATCA GACTCGGATA CGTCCCCCTC ACCGACGCCG CCCCCGTGAT CGCGGCGGCG 
GAACTGGGCT TCGCACGCGC CGAGGGGCTC GAGATCGAAC TCGCGCGCGA GCCCTCCTGG 
GCGACCCTGC GCGACCGGCT GGCGCTCGGC CATCTCGACG CCGCGCACAT GCTCGGGCCG 
CTCGCCATCG CCAGCGCGCT CGGGCTCTCG GGGCCGGAGG CCCGTCTGAG CGTGCCGATG 
GCGCTCGGCC TCAACGGCAA CGCCGTGACC GTCTCGAACG CGCTCTGGGC GGCGATGTCG 
CCGGAGAGCG ACGGGCTGAG TGACGTGGCT GCGGCTTTCT CGGCGGTCGC CCGCGCGCGG 
GCCGGGGAGG GGCGTCCGCT CGTCATCGGC ACCGTGCATC CCTTCTCCAG CCATTCCTAC 
CAGCTCCGCC TGTTCGCCGG CCTGAGCGGG CTCGACCTCG ACGCAACGGT GCGTCTGGTC 
GTGGTGCCGC CGCCGGAGAC GGTGGATGCG CTCCGGCGCG GTCGCATCGA CGGTTTCTGC 
GTCGGCGCCC CCTGGAACAG CGTCGCGGTC GCCGCCGGCC TCGGCCGGAT CGCGGCACTC 
GGTTGCGAGA TCGCGCCCGA CTGCCCGGAG AAGGTGCTGG CGCTGCCCGC GGAGGGGGCC 
GACTTCACGT CACCCTTGGT CAGGGCCGTC CACCGCGCCG GTCTTTGGTG CGCCGCCCCC 
GAGAACCACG AGGCCCTGAG CCGCCTGCTC GCCGAACGGG CAGAACTCGA CGCGGATGCC 
GCGCTTCTCG CGCGCACGCT CAGTGGCGCG CTGATCGTGG ATCGGGACGG AACCGAGCGG 
GCGAACCCGG ACTATCTGCG CCTCGACGCG GCGACCCACC GGCCGGACCC GGAGCATGCC 
CGGTGGCTGG TGGCGCAGAT GGCCGCCTGC GGGCAGGTGG CGTCCGGCGA CGACGCGGAG 
GACCGGGCGG CGGCGCTCTA CCGGCCCGAC CTCTTCGCCG CGGCCATCGG CGGCTGA

Protein sequence

MRIRLGYVPL TDAAPVIAAA ELGFARAEGL EIELAREPSW ATLRDRLALG HLDAAHMLGP 
LAIASALGLS GPEARLSVPM ALGLNGNAVT VSNALWAAMS PESDGLSDVA AAFSAVARAR 
AGEGRPLVIG TVHPFSSHSY QLRLFAGLSG LDLDATVRLV VVPPPETVDA LRRGRIDGFC 
VGAPWNSVAV AAGLGRIAAL GCEIAPDCPE KVLALPAEGA DFTSPLVRAV HRAGLWCAAP 
ENHEALSRLL AERAELDADA ALLARTLSGA LIVDRDGTER ANPDYLRLDA ATHRPDPEHA 
RWLVAQMAAC GQVASGDDAE DRAAALYRPD LFAAAIGG