Gene Haur_4066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4066
Symbol
ID	5735924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5193253
End bp	5194182
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	51%
IMG OID	641281217
Product	ATP synthase F0, A subunit
Protein accession	YP_001546826
Protein GI	159900579
COG category	[C] Energy production and conversion
COG ID	[COG0356] F0F1-type ATP synthase, subunit a
TIGRFAM ID	[TIGR01131] ATP synthase subunit 6 (eukaryotes),also subunit A (prokaryotes)

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000333468
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTTGC TTGTTGTGCT CTCGTTGGCA GCTACTGCAA AATTGCGCAG TGGCAACGAC 
GAAGCCTTGA AGCACCCCAA GGGCTTGCAA AATGCCTTGG AATATGGTGT TGAAGTTCTA 
TACAACACCA TGCAAGGGGT TAGCCCGAAA TATGTAGCCC GCTTCTTTGT CGTGGTTGCA 
ACCATCTTCT TCTTGGTCTT GCCTTCAAAC TGGTTCGGCT TGGTCCCCGG TGTTGGTTCA 
CTTGGGGTTT GTTTTGCTGA ATCAGAATTA GAAGTGATGC ACGGCCATAC TCCGGTAGCT 
GGTGCTGGCC CAAGCGAAAA AGTCATCGGT GCTCAAAAAG TTTGGTCAGA TTACACCAAC 
AAGTGTGCTG GAACTGCTGA TACCTTGGTG CGGGCTGAAG CTTCAGCCCA AGGCATCGTC 
TTGCCAGCAA CCTTGGAAAC GCCTGAGCAA ATTGCCCAAT ACAAGGCAGT CTCAGCCGAA 
CTCGACCACG CTGGCAAAAT CACGCCTTTG TTCCACCCCT TCTTGCGCCC AGGGAGCGCT 
GACTTGAATA TGACCTTGGC TTTGGCCTTG ATCTCATTCG TCGTCACCGA ATTCTGGGGC 
TTCCGCAAGC AAGGCTTTGG CTACTTGGGC AAGTTCTTTA TCTTCAACCA AGGACCAATT 
CAGTTCTTCG TCGGGATTAT CGAACTCGTT TCAGAATTCG CTCGCATCAT CTCGTTTACC 
TTCCGGCTTT TCGGCAACAT CTTTGCCGGC GAAGTGGTGC TCTTGGTGAT GGCGTTCCTG 
TTCCCAGCCT TGCTTTCATT GCCATTCTAT GGCTTGGAAT TGTTCGTGGG CTTGGTTCAA 
GCCTTCGTGT TTGCAATGCT GACCATGGCG TTTATCGATA TGGCTGCTGA ATCGCACGGC 
GATCATGGCC ACGAAGAACA CGCCCACTAA

Protein sequence

MILLVVLSLA ATAKLRSGND EALKHPKGLQ NALEYGVEVL YNTMQGVSPK YVARFFVVVA 
TIFFLVLPSN WFGLVPGVGS LGVCFAESEL EVMHGHTPVA GAGPSEKVIG AQKVWSDYTN 
KCAGTADTLV RAEASAQGIV LPATLETPEQ IAQYKAVSAE LDHAGKITPL FHPFLRPGSA 
DLNMTLALAL ISFVVTEFWG FRKQGFGYLG KFFIFNQGPI QFFVGIIELV SEFARIISFT 
FRLFGNIFAG EVVLLVMAFL FPALLSLPFY GLELFVGLVQ AFVFAMLTMA FIDMAAESHG 
DHGHEEHAH