Gene M446_3501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3501
Symbol
ID	6135017
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	3906650
End bp	3907693
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	68%
IMG OID	641643672
Product	putative ABC transporter periplasmic substrate-binding protein
Protein accession	YP_001770320
Protein GI	170741665
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00652225
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.464247
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGCGGTC GTGACGGGCT GTTCTACCGA AACTTCTCCC GGCGGGGCTT CCTCGCCCGA 
AGCGCCGCCG CGGCGGCGCT CGCCCTGCCG GCCCATCTGG CGGGCCTGCT CGCGCCCGCC 
GCCGCCGGGA CCGTGATCAA GGCCACCCAC GGCTCCGGCT TCTGCAACAT GGGCATCTTC 
CTCGCCAAGG AGCGCGAGCT GACCAAGGCG GACGGCGTCG AACTCGACTT CGTGGTGACG 
CCCTCCAACA CCGAGATCAC CACGATGTTC GGGGCGGGCC TCGTCGACAT GTCGATGATC 
CCCTACTCGA ATTTCATGAC CCTCTACGAC GCGGGCGCGC CGGTGAGGAT CGTCGCGGGC 
GGCGGCGTCG AGGGCTGCAT CATCGTGGCG CGCGACGGCA TCGCCTCCGC GGCCGACCTC 
AAGGGCAAGA CCTTCGGCAC CTTCCAGGCC GACACGCTCG AGGTCCTGCC CTACGACTAC 
CTCAAGAAGG CGGGCCTCGG CTTCCGGGAC GTCGAGATCA AGTACCTCGA CACCTCGCCC 
GAACTGGCCC AGGCCTTCCT GGCCGGCGCC CTCGATGCGA TCTGCCACAT CGAGCCCTAC 
GCCTCGCAAT GCGTGCGCGG CCGCAAGGGC GCGCACGTGC TCTCGGACGG GACCGACGTC 
TACGGCAAGG GCTATTCCGA CTGCGTGCTC GCCGTGCGCA CGCCGCTCCT CAAGAGCAAC 
CCCGCCGCCG TGAAGGCCGT CATCAAGGCC CTGTTCGTGG CCCAGGCCCA GGCCGAGGCG 
GACAAGGGCG CCGCCCTCAA GGACACGGTC GGCAAGTACT ACAAGACCAG CATGGAGGCG 
GCGGTCGACG CCTCCTCCAA GCAGCCGATC GTGGTGGATC AGCGCAACCA GACCCGGTTC 
ATCCTGGCGC GCGGCACCTC GATGCAGGAA CTCGGCTACG TCAGGAAGGC CCCGGACGAG 
GGCGCCTTCG ACTGGAGCCT GCTGGAGGCG GTGATCGCCG AGAACAAGCC CCTGTACGAC 
GGGCTCAAGC TGAAATCGGC CTGA

Protein sequence

MCGRDGLFYR NFSRRGFLAR SAAAAALALP AHLAGLLAPA AAGTVIKATH GSGFCNMGIF 
LAKERELTKA DGVELDFVVT PSNTEITTMF GAGLVDMSMI PYSNFMTLYD AGAPVRIVAG 
GGVEGCIIVA RDGIASAADL KGKTFGTFQA DTLEVLPYDY LKKAGLGFRD VEIKYLDTSP 
ELAQAFLAGA LDAICHIEPY ASQCVRGRKG AHVLSDGTDV YGKGYSDCVL AVRTPLLKSN 
PAAVKAVIKA LFVAQAQAEA DKGAALKDTV GKYYKTSMEA AVDASSKQPI VVDQRNQTRF 
ILARGTSMQE LGYVRKAPDE GAFDWSLLEA VIAENKPLYD GLKLKSA