Gene M446_4759 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_4759
Symbol
ID	6134790
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	5232535
End bp	5233800
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	68%
IMG OID	641644896
Product	extracellular ligand-binding receptor
Protein accession	YP_001771523
Protein GI	170742868
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCGC ACGTCTCGCG CCGCCGCAGC GGCGGGCTCC TGGCCTCCAC GCTGCTGGCC 
ACCACGCTCC TCGGCGCGGC CCTGGCCGCG CCGGCCGACG CCGCCGATCC CATCCGCATC 
GGCATCATCG CGGAGGCCCA GGCGCTCGCC GGCGCCTCGA TCCCGCAGGC CGCCCAGCTC 
GCCGCCGACG AGATCAACGC CAAGGGCGGC GTCGACGGGC GCAAGATCGA ACTCGTCACC 
TACGACGACA AGAGCTCGGC CGCCGACGCG GTCCGGGCCT TCCAGCGCGC CGCCAGCGAG 
GACAAGGTCC ACGCGGTCAT CGCCAGCTAC ATCAGCGAGG TCGTGCTCGC CCTCCAGCCC 
TGGTCGGCCC GGCTGAAGAT GCCCTTCATC ACCCCGGGCG CCGCCTCGAA CGACATTCCC 
CTCAACGTCC ACAAGGATTA CGCCCGCAAC AAGTACTCCT TCCACGGCTA CCTCACCTCC 
AAGGCGCTCT CGCAATCGGT CTGCGACGCC GCCAAGGCGA TCCTGGTCGA GGGCCGCAAG 
ATGAGGACGG CCGTCATCAT GAGCGAGGAC GCCGCCTGGA CGAAGCCCCT CGACGCCGGA 
TACGAGGAAT GCCTGCCGGT CGCCGGGCTC AAGGTGCTCG ACCACATCCG GTTCTCGCCG 
AGCACGACCG ATTTCAGCCC GATCTTCAGC CGCATCGAGG GCGCCAAGCC GGACGTGATC 
ATCACCGGCA TCTCCCATGT CGGCGTGCAG CCGACCGTGC AGTGGAAGAG CCAGCAGGTG 
CCGATCCCCA TGCTCGGCAT CTCCTCGCAG GCCACCAACG CCACCTTCTG GAAGGAGACC 
AACGGCGCCG CCGAGGGCGT GCTGTTCCAG ATGTTCGCGG CGCCCGGGAC CACCGTCACG 
CCCAAGACCG CCCCCTTCGC CGACGCCTTC AAGGCCCGGT ACGGCAATTA CCCGAGCTAT 
GCCGGCTACA CGACCTACGA CGAGGTCTAC TACATCGCCG ACGCCGTGAA GCGGGCCGGC 
TCGACCGATC CCGACAAGCT CGTGGACGCG CTGGAGAAGA CCGACTGGGA AGGCACGATG 
GGCCGCGTCC AGTTCTACGG CAAGGACGAC GACTTCACCC ACTCGGTGAA GTACGGGCCG 
GGCCTGATCT CCGGCATGAT GATGCAATGG CTCGACGGCC GGCAGACCGC CGTGTGGCCC 
GCAACGGTGG CCAACGGCAA GCTGACCTTT CCCGCCTTCG TGAAGGCGGG TGCGCCTGCC 
GAATGA

Protein sequence

MSSHVSRRRS GGLLASTLLA TTLLGAALAA PADAADPIRI GIIAEAQALA GASIPQAAQL 
AADEINAKGG VDGRKIELVT YDDKSSAADA VRAFQRAASE DKVHAVIASY ISEVVLALQP 
WSARLKMPFI TPGAASNDIP LNVHKDYARN KYSFHGYLTS KALSQSVCDA AKAILVEGRK 
MRTAVIMSED AAWTKPLDAG YEECLPVAGL KVLDHIRFSP STTDFSPIFS RIEGAKPDVI 
ITGISHVGVQ PTVQWKSQQV PIPMLGISSQ ATNATFWKET NGAAEGVLFQ MFAAPGTTVT 
PKTAPFADAF KARYGNYPSY AGYTTYDEVY YIADAVKRAG STDPDKLVDA LEKTDWEGTM 
GRVQFYGKDD DFTHSVKYGP GLISGMMMQW LDGRQTAVWP ATVANGKLTF PAFVKAGAPA 
E