Gene Mjls_3864 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_3864
Symbol
ID	4879574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	4092101
End bp	4093747
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	66%
IMG OID	640141176
Product	F0F1 ATP synthase subunit alpha
Protein accession	YP_001072131
Protein GI	126436440
COG category	[C] Energy production and conversion
COG ID	[COG0056] F0F1-type ATP synthase, alpha subunit
TIGRFAM ID	[TIGR00962] proton translocating ATP synthase, F1 alpha subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.283904
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0308391
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGAGT TGACTATCTC GGCTGCTGAC ATCCAAGGGG CGATCGAGGA CTACGTCGCC 
AACTTCGCCA CCGACACCGA GCGGGAAGAG ATCGGCACCG TCATCGACGC CGGTGACGGT 
ATCGCGCACG TCGAGGGCCT GCCCTCGGTG ATGACGCAGG AGCTGCTCGA GTTCCCCGGC 
GGTGTCCTGG GTGTCGCGCT CAACCTCGAC GAGCACAGCA TCGGTGCGGT CATCCTCGGT 
GACTTCGAGA AGATCGAAGA GGGCCAGCAG GTCAAGCGCA CCGGCGAGGT GCTGTCGGTG 
CCGGTGGGTG ACGGTTACCT CGGCCGCGTG GTCAACCCGC TCGGTCAGCC GATCGACGGC 
CGCGGAGAGA TCGAGACCAC CGATCGTCGT GCGCTCGAGC TGCAGGCGCC CTCGGTGGTG 
CAGCGCCAGG GCGTGAGCGA GCCGCTGCAG ACCGGTATCA AGGCGATCGA CTCGCAGACC 
CCGATCGGCC GCGGCCAGCG CCAGCTGATC ATCGGTGACC GCAAGACCGG CAAGACCGCG 
GTCTGCGTCG ACACGATCCT CAACCAGCGG CAGAACTGGG AGACGGGCGA CCCGAACCAG 
CAGGTGCGCT GCGTGTACGT CGCGATCGGC CAGAAGGGCA CCACGATCGC CAGCGTGCGC 
CGCACGCTCG AAGAGGGCGG CGCGATGGAC TACACCACCA TCGTCGCGGC GCCCGCATCG 
GATTCGGCCG GCTTCAAATG GCTTGCGCCC TACACCGGTT CGGCGATCGC CCAGCACTGG 
ATGTACGACG GCAAGCACGT CTTGATCGTG TTCGACGATC TGACCAAGCA CGCCGAGGCC 
TACCGCGCGA TCTCGCTGCT GCTGCGCCGC CCGCCGGGCC GCGAAGCCTT CCCCGGCGAC 
GTGTTCTACC TGCACTCGCG GTTGCTGGAA CGCTGCGCGA AGCTGTCCGA CGAACTCGGC 
GGCGGCTCGA TGACCGGATT GCCGCTGATC GAGACGAAGG CCAACGACAT CTCGGCCTAC 
ATCCCGACCA ACGTCATCTC GATCACCGAC GGGCAGTGCT TCCTGGAGAC CGACCTGTTC 
AACCAGGGTG TGCGTCCCGC CATCAACGTC GGCGTCTCGG TGTCGCGTGT GGGTGGCGCC 
GCGCAGATCA AGGCGATGAA AGAGGTGGCG GGCTCACTGC GACTGGATCT GTCCCAGTAC 
CGCGAGCTGG AGTCGTTCGC GGCGTTCGCC TCCGACCTGG ATGCGACGTC GAAGGCGCAG 
CTGGACCGCG GCGCCCGGCT GGTCGAGCTG CTCAAGCAGC CGCAGAACAG CCCGATGCCC 
GTCGAGGAGC AGGTCGTCGC GATCTTCCTC GGCACCAGGG GTCACCTCGA CACGGTGCCG 
GTCGAGGACG TGCAGCGTTT CGAGCAGGAG CTGCTCGAAC ACGTCCGTTC GTCCAAGGAG 
GAGATCTTCA CCGAGATCCG CGAGAGCAAG AAGCTCTCCG ACGAACTCGA GAAGACGCTG 
ACCGATGTGG TCAACGAGTT CAAGAAGGGC TTCGAGACCA CCTCCGGTGA GTCCGTGGTT 
CCGGACGAGA ACGTCGAGGC CATGTCCGAG GACGACGTCG AGAAGGAATC GGTGAAGGTC 
CGCAAGCCCG CCCCGAAGAA GAAGTAA

Protein sequence

MAELTISAAD IQGAIEDYVA NFATDTEREE IGTVIDAGDG IAHVEGLPSV MTQELLEFPG 
GVLGVALNLD EHSIGAVILG DFEKIEEGQQ VKRTGEVLSV PVGDGYLGRV VNPLGQPIDG 
RGEIETTDRR ALELQAPSVV QRQGVSEPLQ TGIKAIDSQT PIGRGQRQLI IGDRKTGKTA 
VCVDTILNQR QNWETGDPNQ QVRCVYVAIG QKGTTIASVR RTLEEGGAMD YTTIVAAPAS 
DSAGFKWLAP YTGSAIAQHW MYDGKHVLIV FDDLTKHAEA YRAISLLLRR PPGREAFPGD 
VFYLHSRLLE RCAKLSDELG GGSMTGLPLI ETKANDISAY IPTNVISITD GQCFLETDLF 
NQGVRPAINV GVSVSRVGGA AQIKAMKEVA GSLRLDLSQY RELESFAAFA SDLDATSKAQ 
LDRGARLVEL LKQPQNSPMP VEEQVVAIFL GTRGHLDTVP VEDVQRFEQE LLEHVRSSKE 
EIFTEIRESK KLSDELEKTL TDVVNEFKKG FETTSGESVV PDENVEAMSE DDVEKESVKV 
RKPAPKKK