Gene M446_4005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_4005
Symbol
ID	6132980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	4459612
End bp	4460610
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	68%
IMG OID	641644162
Product	transposase IS116/IS110/IS902 family protein
Protein accession	YP_001770802
Protein GI	170742147
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGATGC TCGCGATCGA TCTGGCCAAG CAGTCGTTTC ACGTTCACGG CGTCGATGCC 
GATGGTCAGG TGATCTCCCG GCGCGTCGGG CGCACCAAAC TTCCGGCGCT GGTGGCCAGC 
CTCGCCCCGA AGGTGATCGC CATGGAGGCT TGCGCCACGG CCCATCATTG GGCGCGAGCT 
TTCCTCGCGG CCGGGCATGA GGTTCGGCTG ATCAACCCGC GCTTCGTCAA GCCGTTCGTG 
CGCGGCTCGA AGAACGATGC CGTCGACGCC GAGGCGATCT TCGACGCCGC CTCACGTCCC 
ACGATGCGGT TTGTGCCTGT GAAGTCGACC GAGCAGCAAG ACCTGCAGTC GCTTCATCGC 
GTCCGCGATC GGCTGGTCTC GCAACGCACG AACCTGATCA ATCATACCCG TGGGCTCCTG 
GCTGAGTACG GCCTCATCTA CCCGAAGGGT GCGGCCCGCT TTCCAGCGCG TGTGCGGGCG 
GAACTTTCCG AGGCGGGACT GTCGCCGATG GCGCGAGCCA CCTTCGCGGC CCTGCTCGAC 
GAGTTGGAGA CCCTGGAGAC GCGGCTTGAG CGGCTCGACG ATCAACTTCG GGCGATCTGC 
CGCGAAGACG TCGTCTGCCG CCGCCTGATG ACGTTGCCTG GCGTGGGCCC GGTCGTCGCC 
ACCGCCCTCA AGGCCAGCGT CGGCGATGCC CGCCAGTTCC GCTCAGGGCG CGAACTCGCG 
GCCTGGATCG GCTTGGTGCC GCGACAGTAC TCCACCGGCG GCAAGCCGCA CCTCGGGGGC 
GTCGGACGCC GGGCCAACCA CTATCTGCGG CGCCAACTCG TGCACGGCGC CCGCGCGGTC 
GCCTTGCGCC TGGCCACGAA GACCGATCCG CGCTCACGCT GGTTCCAGGC GGTGATCGAC 
CGGCGCGGGT TCAACAAGGG GATCGTGGCG ATGGCCAACA AGACCGCGCG GATAGCCTGG 
GCGATGCTGA GGCGCGAGGA GGATTACGCC CGCGCCTGA

Protein sequence

MQMLAIDLAK QSFHVHGVDA DGQVISRRVG RTKLPALVAS LAPKVIAMEA CATAHHWARA 
FLAAGHEVRL INPRFVKPFV RGSKNDAVDA EAIFDAASRP TMRFVPVKST EQQDLQSLHR 
VRDRLVSQRT NLINHTRGLL AEYGLIYPKG AARFPARVRA ELSEAGLSPM ARATFAALLD 
ELETLETRLE RLDDQLRAIC REDVVCRRLM TLPGVGPVVA TALKASVGDA RQFRSGRELA 
AWIGLVPRQY STGGKPHLGG VGRRANHYLR RQLVHGARAV ALRLATKTDP RSRWFQAVID 
RRGFNKGIVA MANKTARIAW AMLRREEDYA RA