Gene Rsph17029_4103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_4103
Symbol
ID	4895039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009040
Strand	+
Start bp	44742
End bp	46235
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	73%
IMG OID	640110505
Product	ATP synthase F1, alpha subunit
Protein accession	YP_001041817
Protein GI	126464841
COG category	[C] Energy production and conversion
COG ID	[COG0056] F0F1-type ATP synthase, alpha subunit
TIGRFAM ID	[TIGR00962] proton translocating ATP synthase, F1 alpha subunit

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	0.0134913
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	108
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGTG ATCCGGGACT GGAGGCGCTG AAGGCGCGGG TGGCGGAGGT TCCGCTCGGC 
CCCGAGATCG AGGAGACCGG CCGCATCGCC ACGCTGGCCG ACGGGCTCGT AGAGGTCGAG 
GGCCTGCCCG GCGCGCGGCT GGGCGAGGTG GTGCGTTTCG CGGGCGGCGC CGAGGGGCTG 
GTGCTGACCC TCGATCCCGA GACGGTGCAG GTGGCGCTGC TCGATCCCGG CGCGGCCCTG 
GGCTCGGGCA CCGAGGTGCG CCGCACCGGG CAGCTCCTGT CGGTGCCGGT GGGCCAGGGG 
CTTCTGGGCC GCGTCGTCGA TCCGCTCGGC CGTCCGCTCG ACGGACTGCC CGCGATCCTG 
CCCGAGGCCA GGCTCGAGAT CGAGCGCCCG GCCCCCGGCA TCGTCGACCG CGACATGGTG 
GCCGAGCCGG TGGAGACGGG CCTTCTGGTG GTGGATGCGC TCTTCGCCGT GGGCCGCGGG 
CAGCGCGAGC TCATCATCGG CGAGCGCGCC ACCGGCAAGA CCTCCCTCGC GGTCGATGCC 
ATCGTGAACC AGGCCGCGAG CGACATCGTC TGCTTCTATG TGGCCATCGG CCAGCGCACG 
ACGGCCGTCC GCCGGGTGAT CGAGACCGTG CGCGAGAAGG GGGCCTTCGC GCGCACGGTC 
TTCGTGGTGG CGCCCGCGAC GGCTTCGCCC GGCCTGCGCT GGATTGCGCC CTTCGCCGCG 
ACCTCCATGG CCGAATGGGT GCGCGACCGG GGCGGGCATG CGCTGATCGT CTATGACGAT 
CTGACCAAAC ATGCGGCCGT CCACCGCGAG CTTGCGCTGC TCGCGCGCCA GCCGCCGGGG 
CGCGAGGCCT ATCCGGGCGA CATCTTCTAC CTCCATGCGC GGCTTCTGGA GCGCTCGGCA 
AAGTTGTCGG CTGTCAACGG CGGCGGCTCG CTCACCGCGC TGCCCATCGC CGAGATCGAG 
GCGGGCAACC TCTCGGCCTA TATCCCGACC AACCTGATCT CGATCGCCGA TGGCCAGATC 
GTGACTTCGG CCGCGCTCTT TGCCGCCAAC CAGCGCCCCG CGGTGGATAT CGGCCTGTCG 
GTCAGCCGCG TGGGCGGCAA GGCGCAGCGG GGCGCGCTGA AGGCGGTGGC GGGGCGGGTG 
CGGCTCGATT ATGCGCAATA TCTCGAGATG AAGATGTTCT CGCGCTTCGG CGGCTTCGGC 
GATGCGGCCC TGCGCGCGCG TCTGGCGCGC GGAGAGCGGA TCGGCGCGCT TCTCGCCCAG 
CCGCGCACGA CCCCGCTCTC GACTCCGGTG CAGGTGGCGC TGCTGGCCGC GCTGGCCGAG 
GGCGCGCTCG ACGATGTGCC GCTCGAGGAT CTGACCCGGC TCAAGGCCGC GCTCGGGCCG 
GTGCTGGCCG CGGATGCCTC GCTCGGCCCC TTCTGCGCGG CCCCCGACCG GCTGGAGCCC 
GAGACCCGCG CGGCGCTTCT GGCCTGTGTC CGCCGCGCGC GGGAGGCGCC ATGA

Protein sequence

MSGDPGLEAL KARVAEVPLG PEIEETGRIA TLADGLVEVE GLPGARLGEV VRFAGGAEGL 
VLTLDPETVQ VALLDPGAAL GSGTEVRRTG QLLSVPVGQG LLGRVVDPLG RPLDGLPAIL 
PEARLEIERP APGIVDRDMV AEPVETGLLV VDALFAVGRG QRELIIGERA TGKTSLAVDA 
IVNQAASDIV CFYVAIGQRT TAVRRVIETV REKGAFARTV FVVAPATASP GLRWIAPFAA 
TSMAEWVRDR GGHALIVYDD LTKHAAVHRE LALLARQPPG REAYPGDIFY LHARLLERSA 
KLSAVNGGGS LTALPIAEIE AGNLSAYIPT NLISIADGQI VTSAALFAAN QRPAVDIGLS 
VSRVGGKAQR GALKAVAGRV RLDYAQYLEM KMFSRFGGFG DAALRARLAR GERIGALLAQ 
PRTTPLSTPV QVALLAALAE GALDDVPLED LTRLKAALGP VLAADASLGP FCAAPDRLEP 
ETRAALLACV RRAREAP