Gene M446_1004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_1004
Symbol
ID	6131317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	1122529
End bp	1124406
Gene Length	1878 bp
Protein Length	625 aa
Translation table	11
GC content	67%
IMG OID	641641297
Product	TPR repeat-containing protein
Protein accession	YP_001767970
Protein GI	170739315
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGACG TCGTCCAATG GTCCTGGCGG CCCTTCGGCC GCGCTCTCAT CGCGACCACA 
GCGGCCAGCG TATTGTCAGT GGGAAGCGGA GCCATCGCTT GCCCGCTTGG AAGTCACGAC 
AGCCCGCGCG TGCGGCTTCT CCACACTCTG CTCCAGCCGA GGCCATCGGG CGCCACAGCC 
GAAATTGTGA TCGCGCCGGC CCAGAACCAC GCGCATCCCC GCCCGCCCGC CCGCAACGAA 
CTCGGGACAT ATAGCCACGA CCTCCCGAAA GGGGCGGCCG CGCCGACCTC GTCAGAGCCG 
CCGCCGCTCT ATGACAACCT TGGTCGGCTC ACTTGGCCGG AGGCCCGCCC TGCACACGCC 
GAGGCCGCCG CCTATTTCGA TCAGGCCTAT CGGCTTGCCT GGGCATTCAA TCACGCCGAG 
GCTGCCCGGG CGTTCCGGGC GGCGCAAGTG CTCGATCCGA GCTGCGCCAT GTGCTTCTGG 
GGCGAGGCCT GGGTGCTCGG CCCGCACATC AACTTCCCGA TCGAGGCCGA CGCGAATGCG 
CGAGCACTGG TTGCCCTCGA TGAAGCCAAG CGCTTGGCCC CGTCCTCGGG ACCGGTTGGC 
GCGGCGCTCA TCACCGCGCT TGCGAAGCGC TACTCACCCG ATGACAATGT GGATCGCAGG 
TCACTCGACC ACGCCTATGC CGACGAGATG AAGGGCGTGC AGGCCCGGTT TCCAGAGAGC 
CCGGAGGTTG CGCTGCTCAC GGCAGACGCC CTGATGAACC TGAGCCCGTG GGATTACTGG 
ACGGACAACG GCCGGACCCC CAAAGGCGAA GCAAGGCGGA TGATCGAGCT GATCGAAGGC 
GTGCTTGGTG AGAGCCAGGT AGGGGCTCTC GTTCCAGCAC CCGATCACCC TGGGGCCATT 
CACCTCTACA TCCACGCGGT AGAGGCTTCG GACCGACCCG AACGAGCCGT GCCACATGCC 
GAGCGGCTAG CCGACCTGAT GCCGGGCGCC GGACACATCG TGCATATGCC GAGCCACATC 
TGGTATCGCG TCGGACGCTG GCGTGAGAGC CTCGACGCGA ACCTGCAGGC CGCCGCCGTC 
GACGAGGCGC TAATCCGGCG AGGCGGCGCG AGCCTCCTCT ATTCGGAGGC CTACTACGCC 
CACAACGTCC ACTTCCTCCT CGCGTCGGCC ACAATGGGTG GGGATGGGCA GACCGCGCTC 
GCCGCGGCCG AGAAGCTCGC CGGAATGGTC TCAGATCGAG CTAAGCGTGA AGTGCCCTGG 
TCGCAGCCGA TCGCTGCTGC GCCCTACAGC GCTCATGCGC GGTTCTCGTC CCCAAGCACC 
ATTTTGGCCT TGCCAGCCCC CGACGCGAAC TTCCCGCTCG TTCGCGCGAA TTGGCATTAC 
GCCCGCGGCG TCGCCCTGGC GCGGCTCGGC CGGGGTGACC AAGCACGGTC GGAAGCCGCG 
GAGATCCGAA AGCTGGCCCA GCGGCCGGAG ATCGCCGCCC TCGTGCCTGC CGGCGTTCCG 
GCGCCGGACG TCCTCGCCAT CGCCGCGAAG CTGATAGAGG CCAGGGTGGC CCAGAACGCC 
CGCGATCATG CCCGCTCGGC TGCCCTGTTC AGGGAGGCTG CGGCGATCCA GGAGTTGCTG 
CCCTATATGG AGCCACCTTT TTGGTACTAC CCCGTTCACC AATCGCTTGG TGCCGCGCTT 
TTGGCGCAAG GTCGGCTGGA CGAGGCAGAG GCTGCGTTTC GCACGGCGCT CCGGCATTCG 
CCCAACAATG GTTGGGCGTC CGCAGGCCTG CTGAGGGTGG CCGAGGCACG GGGCGATAGA 
GCCGCCGCGA GCGAGGCGGA ACGGCTGATC AAAAGCAACT GGTTCGGCGG CGATGTGCCG 
GCGCTCGACC GGCTCTGA

Protein sequence

MIDVVQWSWR PFGRALIATT AASVLSVGSG AIACPLGSHD SPRVRLLHTL LQPRPSGATA 
EIVIAPAQNH AHPRPPARNE LGTYSHDLPK GAAAPTSSEP PPLYDNLGRL TWPEARPAHA 
EAAAYFDQAY RLAWAFNHAE AARAFRAAQV LDPSCAMCFW GEAWVLGPHI NFPIEADANA 
RALVALDEAK RLAPSSGPVG AALITALAKR YSPDDNVDRR SLDHAYADEM KGVQARFPES 
PEVALLTADA LMNLSPWDYW TDNGRTPKGE ARRMIELIEG VLGESQVGAL VPAPDHPGAI 
HLYIHAVEAS DRPERAVPHA ERLADLMPGA GHIVHMPSHI WYRVGRWRES LDANLQAAAV 
DEALIRRGGA SLLYSEAYYA HNVHFLLASA TMGGDGQTAL AAAEKLAGMV SDRAKREVPW 
SQPIAAAPYS AHARFSSPST ILALPAPDAN FPLVRANWHY ARGVALARLG RGDQARSEAA 
EIRKLAQRPE IAALVPAGVP APDVLAIAAK LIEARVAQNA RDHARSAALF REAAAIQELL 
PYMEPPFWYY PVHQSLGAAL LAQGRLDEAE AAFRTALRHS PNNGWASAGL LRVAEARGDR 
AAASEAERLI KSNWFGGDVP ALDRL