Gene Hhal_1786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1786
Symbol
ID	4710899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1960051
End bp	1961196
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	71%
IMG OID	639856256
Product	Pyrrolo-quinoline quinone
Protein accession	YP_001003352
Protein GI	121998565
COG category	[S] Function unknown
COG ID	[COG1520] FOG: WD40-like repeat
TIGRFAM ID	[TIGR03300] outer membrane assembly lipoprotein YfgL

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCCGCG TCGGACTGCG CGCCCTCGGT GCCGCTGCGG CGCTCGGCGT GGCCGCAGCC 
GGCTGTTCCT TGCAGGACCC GCTGCCCAAT CCGCAGACCG AGGCGGATGA GGCGCTGGAT 
GTCGAATTGG CGTGGAGCGG GCGGCCGGTG GGCAGTCTGG AATCCGGTGC CTTCGCGCTG 
CAGCCCGCGT ATGCGGACGG CGTGCTCTAT GTGGCCGACG CCCGCGGCTG GGTCCGGGCC 
CTGGATGCCG AGACCCGTCA GCCCGTCTGG CACGATCGCC TGGAGCGGCC GCTCTCCGCC 
GGGCCGGTGG TAGCCGGGGA CCGTCTGCTG GTGGGGGACC GCAAGGGCCG AATCTACGCC 
TACGAGCGGG AGAGCGGTGA GCCGGTCTGG ATGACCGGCC TGTCGGCGCA GGTCCTGGCG 
AGTCCGCGCT ACACCCGCGG GGTGGTGGTG GCCCGCAGCG CCGATGGACG GGTCTACGGT 
CTCGACGCCG AGGATGGGTC GCGGCAGTGG ATCTTTGACC GCAGTGTGCC CGCCCTGACC 
CTGCGCCGGA ACAGTGCCCC GGCGGTCAGC GGTGGTACCG CGGTGGTGGG TCTCCAGAAC 
GGCCGGCTCG CGGCGCTGAA CGTGGCGGAT GGCAGCGTGC GCTGGGAGCA CACCCTGACC 
GAGCCGAGGG GGCGTACCGA GCTCGAGCGG ATGGCGGACA TCGCGGCCGA TCCGGTCATC 
CATCGCGGTG CGGCCTATGC AGTGGCCTAC CAGGGCGCGA TCGGCGCAGT GCGGATCGCC 
AATGGCGCCC AGCACTGGAG CCGCGAGGTG GGCAGCCATC GAGGGTTGGT CGCCCACGAT 
GAAGAGGTCT ACCTGGCCGC CGATGACGGC CGGGTCTGGG CCTTTGATCG CCGAAATGGC 
GCCACAGCTT GGCGGCAGGA GGCCCTGGAG GGGCTGACCC TGACCCGTCC GGTGGTCCAC 
GAGGGCTATC TGGTCATGGG AGACGACGCC GGTCACGTCA ACTGGCTGCG CCTCAGGGAT 
GGCGAACTCG TGGCCCGCGA GCGCCTCTCC GATGTCCCAG TGGAGCGGCC GCCGGTGGTG 
ACCGGCAGCG GTGATGTCTA CGTCATGGAT GCCCGCGGGC GGATGACCGC GCTGCGCCCG 
CGTTAG

Protein sequence

MIRVGLRALG AAAALGVAAA GCSLQDPLPN PQTEADEALD VELAWSGRPV GSLESGAFAL 
QPAYADGVLY VADARGWVRA LDAETRQPVW HDRLERPLSA GPVVAGDRLL VGDRKGRIYA 
YERESGEPVW MTGLSAQVLA SPRYTRGVVV ARSADGRVYG LDAEDGSRQW IFDRSVPALT 
LRRNSAPAVS GGTAVVGLQN GRLAALNVAD GSVRWEHTLT EPRGRTELER MADIAADPVI 
HRGAAYAVAY QGAIGAVRIA NGAQHWSREV GSHRGLVAHD EEVYLAADDG RVWAFDRRNG 
ATAWRQEALE GLTLTRPVVH EGYLVMGDDA GHVNWLRLRD GELVARERLS DVPVERPPVV 
TGSGDVYVMD ARGRMTALRP R