Gene M446_5467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5467
Symbol
ID	6131820
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	5997754
End bp	5998698
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	74%
IMG OID	641645601
Product	aliphatic sulfonate ABC transporter periplasmic ligand-binding protein
Protein accession	YP_001772217
Protein GI	170743562
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.221886
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACGCA GAGACCTCCT CGCCGGCGCC TCGGCGCTCC TCGCCGCCGG CGGCCTTCCC 
GCCCGCGCGG CCGCGGCCCT GCCCAGGGAA CTGCGCCTCG GCTTCCAGAA ATCCGGCCTG 
TTCGTCTCGG CCCGCCAGCG CGGCGTCTAC GAGGCGCATT TCCGGCCGCT CGGCGTCCCG 
GTGCGCTGGG TCGAGTTCCA GTTCGGCCCG CCCATGCTGG AGGCGCTGAA CCTCGGCGCC 
ATCGACTTCG CCACGGTGGG CAACGCCCCG CCGATCTTCG CCCAGGCCGC CTCCGGCAAC 
CTCCTGTACG TGGCCGCCCA GGAGGCGGGC GGCGAGGCCG TGATCGTGCC CGAGGGCTCG 
GGGCTGCGCA GCCTCGCCGA CCTCAGGGGC CGCACGGTCG GGGTGCCCAA GGGATCGAGC 
GCCCACGCCA CCCTGGTGGC GGCGGTCGAG AAGGGCGGCC TCGGCTGGGG CGACATCAAC 
CCGGTCTACC TCGCCCCCGC GGACGGCGTC GCGGCCTTCG CCCGCGGCGC GATCGACGCG 
TGGTCGATCT GGGATCCCTA CCTGGCGATC GCGGAGGGCA AGGGGGCCCG CGTCCTCGCC 
CACAACCACG AGGTGGCGAA CCCGCACAGC TTCTACCTCG CCAACCGGGC CTTCGCCGAG 
ACCTACCCGG AGGTGGTCGG TCAGATCGCG GACGTGCTGG CGCGGGAAGC CGCCTGGGCC 
GAGGCCAACC GCGACGCCTA CGCGCGGACG TTGCACGAGG CGCAGGGCAT CCAACTCGAG 
GTCGAGGCGG CGATCGTCGC CCGCACCCGC TTCCGGATCA AGCCGATCGA CGAGGCGGTC 
CTGGACGGCC AGCAGGCCAC CGCCGACCGC TTCCACCGCC TCGGCCTGAT CCCGCGCGCG 
ATCCGGGTCC GCGACATCGC CTGGGCCTGG ATCCCCAAGG CCTGA

Protein sequence

MRRRDLLAGA SALLAAGGLP ARAAAALPRE LRLGFQKSGL FVSARQRGVY EAHFRPLGVP 
VRWVEFQFGP PMLEALNLGA IDFATVGNAP PIFAQAASGN LLYVAAQEAG GEAVIVPEGS 
GLRSLADLRG RTVGVPKGSS AHATLVAAVE KGGLGWGDIN PVYLAPADGV AAFARGAIDA 
WSIWDPYLAI AEGKGARVLA HNHEVANPHS FYLANRAFAE TYPEVVGQIA DVLAREAAWA 
EANRDAYART LHEAQGIQLE VEAAIVARTR FRIKPIDEAV LDGQQATADR FHRLGLIPRA 
IRVRDIAWAW IPKA