Gene Mkms_3952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3952
Symbol
ID	4611891
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	4165538
End bp	4167184
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	66%
IMG OID	639793635
Product	F0F1 ATP synthase subunit alpha
Protein accession	YP_939934
Protein GI	119869982
COG category	[C] Energy production and conversion
COG ID	[COG0056] F0F1-type ATP synthase, alpha subunit
TIGRFAM ID	[TIGR00962] proton translocating ATP synthase, F1 alpha subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0936185
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00501194
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCAGAGT TGACTATCTC GGCTGCTGAC ATCCAAGGGG CGATCGAGGA CTACGTCGCC 
AACTTCGCCA CCGACACCGA GCGGGAAGAG ATCGGCACCG TCATCGACGC CGGTGACGGT 
ATCGCGCACG TCGAGGGCCT GCCCTCGGTG ATGACGCAGG AGCTGCTCGA GTTCCCCGGC 
GGTGTCCTGG GTGTCGCGCT CAACCTCGAC GAGCACAGCA TCGGTGCGGT CATCCTCGGT 
GACTTCGAGA AGATCGAAGA GGGCCAGCAG GTCAAGCGCA CCGGCGAGGT GCTGTCGGTG 
CCGGTGGGTG ACGGTTACCT CGGCCGCGTG GTCAACCCGC TCGGTCAGCC GATCGACGGC 
CGCGGAGAGA TCGAGACCAC CGATCGTCGT GCGCTCGAGC TGCAGGCGCC CTCGGTGGTG 
CAGCGCCAGG GCGTGAGCGA GCCGCTGCAG ACCGGGATCA AGGCGATCGA CTCGCAGACC 
CCGATCGGCC GCGGCCAGCG CCAGCTGATC ATCGGTGACC GCAAGACCGG CAAGACCGCG 
GTCTGCGTCG ACACGATCCT CAACCAGCGG CAGAACTGGG AGACGGGCGA CCCGAACCAG 
CAGGTGCGCT GCGTGTACGT CGCGATCGGC CAGAAGGGCA CCACGATCGC CAGCGTGCGC 
CGCACGCTCG AAGAGGGCGG CGCGATGGAC TACACCACCA TCGTCGCGGC GCCCGCATCG 
GATTCGGCCG GCTTCAAATG GCTTGCGCCC TACACCGGTT CGGCGATCGC CCAGCACTGG 
ATGTACGACG GCAAGCACGT CCTGATCGTG TTCGACGATC TGACCAAGCA CGCCGAGGCC 
TACCGCGCGA TCTCGCTGCT GCTGCGCCGC CCGCCGGGCC GCGAAGCCTT CCCCGGCGAC 
GTGTTCTACC TGCACTCGCG GTTGCTGGAA CGCTGCGCGA AGCTGTCCGA CGAACTCGGC 
GGCGGCTCGA TGACCGGATT GCCGCTGATC GAGACGAAGG CCAACGACAT CTCGGCCTAC 
ATCCCGACCA ACGTCATCTC GATCACCGAC GGGCAGTGCT TCCTGGAGAC CGACCTGTTC 
AACCAGGGTG TGCGTCCCGC CATCAACGTC GGCGTCTCGG TGTCGCGTGT GGGTGGCGCC 
GCGCAGATCA AGGCGATGAA AGAGGTGGCG GGCTCGCTGC GACTGGATCT GTCCCAGTAC 
CGCGAGCTGG AGTCGTTCGC GGCGTTCGCC TCCGACCTGG ATGCGACGTC GAAGGCGCAG 
CTGGACCGCG GCGCCCGGCT GGTCGAGCTG CTCAAGCAGC CGCAGAACAG CCCGATGCCC 
GTCGAGGAGC AGGTCGTCGC GATCTTCCTC GGCACCAGGG GTCACCTCGA CACGGTGCCG 
GTCGAGGACG TGCAGCGTTT CGAGCAGGAG CTGCTCGAAC ACGTCCGTTC GTCCAAGGAG 
GAGATCTTCA CCGAGATCCG CGAGAGCAAG AAGCTCTCCG ACGAACTCGA GAAGACGCTG 
ACCGATGTGG TCAACGAGTT CAAGAAGGGC TTCGAGACCA CCTCCGGTGA GTCCGTGGTT 
CCGGACGAGA ACGTCGAGGC CATGTCCGAG GACGACGTCG AGAAGGAATC GGTGAAGGTC 
CGCAAGCCCG CCCCGAAGAA GAAGTAA

Protein sequence

MAELTISAAD IQGAIEDYVA NFATDTEREE IGTVIDAGDG IAHVEGLPSV MTQELLEFPG 
GVLGVALNLD EHSIGAVILG DFEKIEEGQQ VKRTGEVLSV PVGDGYLGRV VNPLGQPIDG 
RGEIETTDRR ALELQAPSVV QRQGVSEPLQ TGIKAIDSQT PIGRGQRQLI IGDRKTGKTA 
VCVDTILNQR QNWETGDPNQ QVRCVYVAIG QKGTTIASVR RTLEEGGAMD YTTIVAAPAS 
DSAGFKWLAP YTGSAIAQHW MYDGKHVLIV FDDLTKHAEA YRAISLLLRR PPGREAFPGD 
VFYLHSRLLE RCAKLSDELG GGSMTGLPLI ETKANDISAY IPTNVISITD GQCFLETDLF 
NQGVRPAINV GVSVSRVGGA AQIKAMKEVA GSLRLDLSQY RELESFAAFA SDLDATSKAQ 
LDRGARLVEL LKQPQNSPMP VEEQVVAIFL GTRGHLDTVP VEDVQRFEQE LLEHVRSSKE 
EIFTEIRESK KLSDELEKTL TDVVNEFKKG FETTSGESVV PDENVEAMSE DDVEKESVKV 
RKPAPKKK