Gene Emin_1519 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1519
Symbol
ID	6263600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1609945
End bp	1611483
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	45%
IMG OID	642612006
Product	ATP synthase F1, alpha subunit
Protein accession	YP_001876403
Protein GI	187251921
COG category	[C] Energy production and conversion
COG ID	[COG0056] F0F1-type ATP synthase, alpha subunit
TIGRFAM ID	[TIGR00962] proton translocating ATP synthase, F1 alpha subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.283334
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000000000000106657
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCTTAA AAGCAGAGGA AATTACAAGC ATTATAAAGA GTAAGATAGC AAACTTTACT 
CCGCAGGCTG ATATTAACGA AACTGGCACC GTTTTACAAG TTGGCGACGG TATTGCCCGC 
ATTTATGGTT TAAAAAACGC CGTGGCGGGT GAGCTTTTGG AATTCCCCAA CAACGTAAAA 
GGCCTTGCCC TTAACTTAGA AACGGACAAT ATCGGCTGCG TGCTTATGGG GGAGGATTCC 
TCCATACAAG AAGGTGACCC TGTTAAAAGA ACCGGCCAAG TTATCAACGT TCCCGTTGGG 
GACGCGCTTT TAGGCCGCGT GGTTGACCCT TTAGGCAAGC CTTTAGACGG CAAAGGCCCT 
ATTAAAACAA ACTCTTCAAG ACCTTTGGAA ATTGTAGCTC CCGGCGTTAT TGAACGCCAG 
CCCGTTAAAC AACCTCTGCA AACAGGGTTA AAAGCTATTG ACTCACTTGT TCCTATAGGC 
AAAGGACAGC GTGAACTTAT TATCGGCGAC AGGCAGACAG GTAAAACTGC CATCGCCATT 
GACGCTATTT TAAATCAAAA AAACCAGCCC GCAGACCAAA GAACGCTTTG CGTTTACGTA 
GCCATCGGGC AAAAACAAAG CACGGTAGCC CAGGTTGTGC AAACCTTAAC GGAATTCGGC 
GCGATGGAAT ATACTGTAAT CGTATCTGCC AGCGCGGCTG ACCCGGCTTC CCTTTTATAT 
ATAGCTCCTT ACGCGGGCTC GTCAATAGCT GAGGAGTTTA TGTGGAATAA ACGCGACGTT 
CTTATTATTT ATGACGATTT ATCAAAACAC GCCCAGGCTT ATAGACAAAT GTCGCTCCTT 
TTACGCAGAC CTCCGGGCCG CGAAGCTTAT CCCGGCGACG TTTTTTACTT GCATTCAAGA 
TTGTTAGAAC GCGCGTGCAA ACTTTCTGAC AAAAACGGCG GCGGCTCTAT TACGGCGCTG 
CCTATTATTG AAACACAGGC TAACGACATG TCTGCCTATA TTCCAACAAA CGTAATTTCA 
ATTACTGACG GGCAAATTTA CTTAGAAAGC GGTCTTTTCC ACAGCGGTAT GAAACCGGCG 
GTTAACGTAG GTCTTTCCGT ATCGCGCGTG GGCGGTTCGG CGCAGAAAAA GATTATGAGA 
AGCGTTTCCG GCACACTGCG TTTGGATATG TCCCAATATA AAGAATTGGA AGCTTTTTCC 
CAATTCGGCA GCGATTTGGA CAAAGAATCA CAGCAACAGC TTACAAGAGG CAAAAGAATA 
AACGAACTTT TTAAACAAGA CCAATATACT CCTATGCCGG TTGAGGAGCA GGTTTTGGTA 
TTCTTTGCCG GCACAAACGG ATTTTTAGAC AATATTGAAG TAAATTTGGT TAAAGAGTAT 
GAAAAACAGC TTCTTACTTA CTTTAAAGCG GAAAAGAAAG ATTTGTTTGA AGAACTTAAG 
AACGCTCCCG AAATGAGTGA AAACCTTACA AATAAATTAA AAGAGGCTTT AACAGCATTC 
GGTGAAGTTT TTAAAAACTC GCACAGTACG GCGCAGTAG

Protein sequence

MSLKAEEITS IIKSKIANFT PQADINETGT VLQVGDGIAR IYGLKNAVAG ELLEFPNNVK 
GLALNLETDN IGCVLMGEDS SIQEGDPVKR TGQVINVPVG DALLGRVVDP LGKPLDGKGP 
IKTNSSRPLE IVAPGVIERQ PVKQPLQTGL KAIDSLVPIG KGQRELIIGD RQTGKTAIAI 
DAILNQKNQP ADQRTLCVYV AIGQKQSTVA QVVQTLTEFG AMEYTVIVSA SAADPASLLY 
IAPYAGSSIA EEFMWNKRDV LIIYDDLSKH AQAYRQMSLL LRRPPGREAY PGDVFYLHSR 
LLERACKLSD KNGGGSITAL PIIETQANDM SAYIPTNVIS ITDGQIYLES GLFHSGMKPA 
VNVGLSVSRV GGSAQKKIMR SVSGTLRLDM SQYKELEAFS QFGSDLDKES QQQLTRGKRI 
NELFKQDQYT PMPVEEQVLV FFAGTNGFLD NIEVNLVKEY EKQLLTYFKA EKKDLFEELK 
NAPEMSENLT NKLKEALTAF GEVFKNSHST AQ