Gene Hhal_1424 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1424
Symbol
ID	4709973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1538070
End bp	1539407
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	68%
IMG OID	639855891
Product	hypothetical protein
Protein accession	YP_001002993
Protein GI	121998206
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.294946
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACGG CAAGCGTCGT CGGCGCCCGG TCCGGGCGCC GTGTCCGCCC GCCCCGTTGG 
ATCGCGGGCC TGGCCTTGGC CGCCGGGGTC GGCTCGCCGG CCCTGGCCGA CTGGGACGAC 
GATCCGTGGG CGGACGACCC CTGGGACGAG GAGGAGCAGT GGCTCCCTTT TGAGGTGGAC 
GGCTTCGTGG AGATCGCCGG CGGCCACCAC ACCCGGGATA ACCAGGTCCT GGACAAGGAC 
TACAACCTGG CCGAGGCCCG CCTGCGCCTG GAGGCGCGGG GGGACTGGCG CCGATTCGAT 
TTCCGGGTCC GCGGTGACGG CGTGGCCGAC CAGGTCAAGG AGGAGATCCG CGGCGAGCTG 
CGCGAGGCTC GGGTTGCCTT CCCCGTTGGG CAGCGGCTGG ACATGCGGGT CGGTCGTCAG 
GTACTGGCCT GGGGGACCGG CGATCTGCTC TTCATCAACG ATCTCTTCCC CAAGGATTTC 
AACTCGTTCC TCACCGGCCG CGACGAGGAC TACCTGCAGG GTCCCTCCGA TGCGGTGCGC 
GGCACCTGGT ACGGCGACAA CGTGACCCTG GACCTGGTCT GGACCCCCGT CTTCGAACCC 
GACGATTATC CGAACGGGGA GCGGCTGAGT TACTTTGACC TCCGTGAGGA GCGCCAAACC 
GAGCAATCGC CACCCGCCGA CGACCCGGAC AGCTTCCCGG ACGACGGTGA GCTGGCGGCG 
CGGCTGACCC ACCGCATCGG CAGCGCCGAG CTGGCCGGGT ACTTCTACCG CGGCTTCTTC 
CCGCAGCCGG AGGAGCAGGC CAACGACCGC CTCACCCACG CCCGGCTCAA CGCCTACGGC 
GCCAGCATCC GGGATCGGCT CGGCCCGGGC ATTGCCAACG CCGAGGTCGG CTACTACGAC 
TCGGTGGACA ACCGCGACGG CGATCGCAGC GTGCAGGTCC CGAACTCGGA GTTCCGGGCG 
TTGCTGGGCT ACACCTGGGA GGCGGCGACA AACTTCGACG TGGGTCTGCA GTACTACCTG 
GAGTGGCTAC AGGATTACGA CGACCTGGAG GCCCGATGGC AGGCGGACGA CGACCTGCTC 
CCCGAGGAGT ACCGCCAGGT GCTCACCACC CGGCTCACCT ACAGCGTGTG GCGGGACAAC 
CTGATCGGCT CGCTGTTCGC CTTCTACTCG CCGGACGACG AGGATTACTA CCTACGGCCG 
TCGGTGCGCT ACCGCGCCTC CGATGCATTG AGCTATTCGG TGGGAGGAAA CCTGTTCGGC 
GGCGACAGCG ACCACACCTT TTATGGGCAG TTCAAGCGGG ATTCCAACCT CTACGCCCGA 
GTCCGCTATC GCTTCTGA

Protein sequence

MSTASVVGAR SGRRVRPPRW IAGLALAAGV GSPALADWDD DPWADDPWDE EEQWLPFEVD 
GFVEIAGGHH TRDNQVLDKD YNLAEARLRL EARGDWRRFD FRVRGDGVAD QVKEEIRGEL 
REARVAFPVG QRLDMRVGRQ VLAWGTGDLL FINDLFPKDF NSFLTGRDED YLQGPSDAVR 
GTWYGDNVTL DLVWTPVFEP DDYPNGERLS YFDLREERQT EQSPPADDPD SFPDDGELAA 
RLTHRIGSAE LAGYFYRGFF PQPEEQANDR LTHARLNAYG ASIRDRLGPG IANAEVGYYD 
SVDNRDGDRS VQVPNSEFRA LLGYTWEAAT NFDVGLQYYL EWLQDYDDLE ARWQADDDLL 
PEEYRQVLTT RLTYSVWRDN LIGSLFAFYS PDDEDYYLRP SVRYRASDAL SYSVGGNLFG 
GDSDHTFYGQ FKRDSNLYAR VRYRF