Gene Hhal_1958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1958
Symbol
ID	4710931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2153118
End bp	2154671
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	69%
IMG OID	639856431
Product	hypothetical protein
Protein accession	YP_001003524
Protein GI	121998737
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCCAGG ATCCCTTTGA CGTACCGCCC CTTGCCGCGG ACCCGGAGGC CAACGGCCCG 
CCGCACATGG AGACCGAAGC CACCGGGCAC GTGCGCCCGC ACCCGGCCAG TAGTGAGCAC 
CAACAGGCGC TCGGCTTCCC CGGCGAGATC CCGGAGGACT GGCAGGAGCG CGCCCTGGCC 
CGCATGGAGA CCCTGCTCGA GCGCAATCGC TCGCTGCGCG TCTACATGGA CGCCTGCGTG 
CGCTGCGGCG CCTGCACCGA CAAGTGCCAC TTCTACCTGG GCACCTCCGA CCCGCAGAAC 
ATGCCCGTGG CCCGCCAGGA TCTGATGCGC GACGTCTACC GGCGCCACTT CACCCCTGCC 
GGGCGCAACT TCCCCAGCCT GGTCCGTGGC CGCGAGCTGA CCCGCGAGGT GATGGAGGCG 
TGGTTCACCT ACTTTCATCA GTGCTCGCAG TGCCGGCGCT GCTCGGTCTT CTGCCCCTAC 
GGCATCGACA CCGCCGAGAT CTCCATGGCT GCTCGGGAGA TCCTCGACGC CGCCGGCTTC 
GGCCAGAAGT ACACCAACGA GATCATCGGC AAGGTCCACA AGGTGGGCAA TAACCTCGGC 
CTCCCCGGGC CGGCACTGGA GGACACCCTT GAGGGTCTGG AGGAGGACCT CAAGGACGAC 
ACCGGCCACG ACATCCGCAT CCCCCTCGAC CAGGAGGGCG CGGACATCCT GCTGGTCACC 
CCGTCAGCAG ACTTCTTCGC CGAGCCCCAC GTCGACGGCC TGATGGGGTA CGCCAAGGTC 
CTGCACCAGG CCGGGCTCTC CTGGACGCTG AGTTCCTACG CCTCGGAGGC GGCCAACTTC 
GGGATGTTCA TCGGCAGCTA CGAGCAGATG AAGCAGATCG CCGAGCGCAT CCGCAAGGCC 
GCCGTCGACC TGGGCGTCAA GCGCATCGTG GTCGGCGAGT GCGGCCACGC CTGGCGGGTG 
GCGTACAGCT TCTGGAACAC CCTGGCCGGC ATCGGCCGCG GGGCCGACGC CGACGACGAG 
TACGCGCGGG CCCTGCAGCG CCAGCTCGAT CCGCGTTACC CGGTACCGCA GCACATCTGC 
GAACTCACCC AGGACCTGGT CGATCGTGGC GCCATCCGCC TTGATCCGGA GGCCAACAGC 
CACTACGGCG GTGTCACCTT CCACGATTCC TGCAACGTCG CCCGCGCCTC CCGCATGGGG 
CAGCGCCCCG GGGGGCAGCT GGAGATCCCC CGCCGGCTGC TGCGCGCCAG TGTCCACAAC 
TACCAGGACA TGGCCGACGC CACCATCGGC GACCGGACCT TCTGCTGCGG GGGCGGGGGC 
GGTCTGCTGA CCGACGAACT CATGGAGCTG CGCGTCAAGG GCGCGCAGCC GCGCGTCTCG 
GCGCTGCGCG AGACCATGGA CGAACACGGG GTCGACCGCA TGGTGGCCAT CTGCGCCATC 
TGCAAGGCCC AGTTCAGCAA GGTCCTGCCG TACTACGACA TCCCGCGCGA GACCATCATC 
AGCCTCCACG AGGTGGTGGG CAACGCGGTG CGGCTGGATC GCAGCGAGGC TTGA

Protein sequence

MSQDPFDVPP LAADPEANGP PHMETEATGH VRPHPASSEH QQALGFPGEI PEDWQERALA 
RMETLLERNR SLRVYMDACV RCGACTDKCH FYLGTSDPQN MPVARQDLMR DVYRRHFTPA 
GRNFPSLVRG RELTREVMEA WFTYFHQCSQ CRRCSVFCPY GIDTAEISMA AREILDAAGF 
GQKYTNEIIG KVHKVGNNLG LPGPALEDTL EGLEEDLKDD TGHDIRIPLD QEGADILLVT 
PSADFFAEPH VDGLMGYAKV LHQAGLSWTL SSYASEAANF GMFIGSYEQM KQIAERIRKA 
AVDLGVKRIV VGECGHAWRV AYSFWNTLAG IGRGADADDE YARALQRQLD PRYPVPQHIC 
ELTQDLVDRG AIRLDPEANS HYGGVTFHDS CNVARASRMG QRPGGQLEIP RRLLRASVHN 
YQDMADATIG DRTFCCGGGG GLLTDELMEL RVKGAQPRVS ALRETMDEHG VDRMVAICAI 
CKAQFSKVLP YYDIPRETII SLHEVVGNAV RLDRSEA