Gene Hhal_2278 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2278
Symbol
ID	4709469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2499555
End bp	2501993
Gene Length	2439 bp
Protein Length	812 aa
Translation table	11
GC content	70%
IMG OID	639856754
Product	hypothetical protein
Protein accession	YP_001003844
Protein GI	121999057
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCCCGAC TCCCCCGTCC CCACGCCTTG CTCACTGCCA GTGCCGCGGC GGCCCTGATG 
GCCAGCGGCT GCGCTGCCCT CGATGAGGAG TACGAGGCCG CCCTACTGCT CAGCGACCTA 
GGCGCCGAGG GCCACGAAAA GACCCGCCTG CAGGATCGCG GCGGTGATCC GGAAGTGACC 
TCCGTCCGCT ACGACAAGGG CCAGGGTGAG CGCGAGGCCG ACCTCTACCG GCCCGACGGC 
GAGGCCCGCG GGAACCTGGT GCTGATCCAC GGGCTGACCG AGCAGGGCAA GGACGATCGC 
CGACTGGTGG AGATGGCCGA GAGCCTGACC CGGGTCGGTT ACCGGGTCCT GGTGCCCGAG 
GTAGAGGAGC TCCGTGAGCT GCGCTGGGGG CCGGAGAATC GCGACGACGT GGCTGATGCG 
GTGCGCCATA TGGCCAACCG GGAGGCGAGC CGCGGTCTGC CCCTGGGGGT CAGCACCCTG 
AGCCTGATGA GCGGCCCGGT GCTGCTCGCC ACCGCCGATG ACGAATTGCG TCGGCGGGTC 
GAGTTCGTCG CCCTGATTGG CGGCTATTAC GACATCGAGG CGTGGCTGCG CTACGTGACC 
ACCGGTCATG ACCCGCTGGC GGATGCCCGG GACGACCCGG AGCCCCGCCC GGAAAGCCGC 
TGGGTCCTCC TGCAGGCGCT GGCGGCCCGG GTGGACGAGG ACGACCGGGA GTGGATGCAG 
CGCATCGCCG AACGCCGCCT GGACGATCCC GAGGCAGATA TCACCGCCGA ACGGGCGGCG 
CTGGGCGAGG AGGCAGCCGC CCTGGTGGAT CTGCTGGTCA ACGACGACCC GGAGGCCTTC 
GATGACGACC TGGCGGAGAT CCCCGCGGCG TACCGCGAGG CGCTGGACGA GCTGGATCCC 
TCCCGCCACG ACTGGTCGGA CTACCACCCG GAGTTGCTGC TGATCCACGG CACCAACGAC 
CCGGTGGTGC CCTTCTCCCA CAGTGAGGCG CTGGAGGCCG CTGCCCCGGA TGCGCACCTG 
TACCGCAGCG CCGGACTCGC CCATGTGGAC CTGGAGGGCG GACTGTTCGA CAGCGTCCGG 
CTCTGGCGGG CGGCCTCGGC GCTGCTGGAC GTCCGCCTGG ACCCGGAGCA GCCCCTGGCA 
TCGGACCCGG GACGGAATGT CTACATCCCG CCGCGCGGTG AACTCGAGCG CACCCTGCGC 
GTGGGCGCCG TCTACAACGA TGACGAGATC CAGATCCGTT ACGAGTTCGC CACCGAGGCC 
CCGTCCTGGT ACCACCAATA CTGGATCTAC GAGGTGGAGG GGCGCGGGAC CGGCGGCGAG 
TGGGTGCAAT ACGGCAGTGG CGGCCCGGAG CCCGATGAGC ACGGCCTCTA CGAGGATCGC 
ATCTCCATGC TCCTCGACGA TGGGGATCTG GGGCTCGATC GCTACGGCGG CTTCATGACC 
GCCCACGAGG GCATGCGCGG GCTCACCGGG GCCGCCGAGT CCGAGGAGGT CGAGGCCCAT 
CCCCACCTGG GCGAGACCCT GGGGCGCTCG GACGTGCGCA AGTACATCCC CCAATCGCGG 
GAGGACGGGG ACAACGGTGG CGCGGACTGG CAGGACGTGC GTGATGAGGC CGAGCTCGAG 
GCCATGCGCG AGCGGGGCGA GTTCCTCGAC CTCTGGCAGT GGCGCGCCCA CCGTTCCCAC 
CCGCTGGGCT ACGCCGACAA CGGCTACGTC CTGGAGTACC GCCACAGCTC CGAGGGGCGG 
GGGATGTTCA CCGACAACTG GGACGACGAG GCCGATCAGC CCCGTTGGAT GTACGACCCG 
GACGAGGCGG GCTTCCGGGC CCTGGAGCGC GACCGGCTAC TGGATGGTGC CTATGACCAG 
GACGATCTCT ACTACCTGAG CGAGGGGCAC GCCACCGACT TCGATCCGGA CCACCACTGG 
GAGGACGGCG ACGTCCTGCC CCAGCGCTTC CTGCAGGAGC CCGATGGGAG CCGTGGGGCG 
ATCCGCGCCG CTGGCGGCTA TGAGGACGGT GCCTGGCGGG TGCGCCTGAC CCGCTCGCTC 
GAGGCGCCGG AGCCCACCGA TAGCCACACC CTGGAGCCGG GCGGGGTCTA CGACGTGGCC 
TTTGCCGTTC ACGAGGGCGT GGGCCAGCGC TGGCACCGGG TCTCACTGCC GCAGACGCTC 
GCCCTGGCCG AGGAAGCGGC GGATGCGCCG GAGGCCGACA TCGTGGCCAC GCACACGGAG 
GGCGATCTGG ACGATGCCGA CGTGGAGTGG ACTGAGGTCG GGTTGATCTA CCCGGGGCAG 
ATGACCTGGG ACTGGCTCAC CGATCGCAGC CCCGCCGGCC ACCCCGGTGC CGGTCATGTC 
ATCGGTGGTG AGCGCGCCAT CGGCGACGAG CACCGGCTGC CAAGGTTGCA GGACTACCTG 
CTCTACGAGG AGCGCCGGCG CATCGATCAG CAGGACTGA

Protein sequence

MSRLPRPHAL LTASAAAALM ASGCAALDEE YEAALLLSDL GAEGHEKTRL QDRGGDPEVT 
SVRYDKGQGE READLYRPDG EARGNLVLIH GLTEQGKDDR RLVEMAESLT RVGYRVLVPE 
VEELRELRWG PENRDDVADA VRHMANREAS RGLPLGVSTL SLMSGPVLLA TADDELRRRV 
EFVALIGGYY DIEAWLRYVT TGHDPLADAR DDPEPRPESR WVLLQALAAR VDEDDREWMQ 
RIAERRLDDP EADITAERAA LGEEAAALVD LLVNDDPEAF DDDLAEIPAA YREALDELDP 
SRHDWSDYHP ELLLIHGTND PVVPFSHSEA LEAAAPDAHL YRSAGLAHVD LEGGLFDSVR 
LWRAASALLD VRLDPEQPLA SDPGRNVYIP PRGELERTLR VGAVYNDDEI QIRYEFATEA 
PSWYHQYWIY EVEGRGTGGE WVQYGSGGPE PDEHGLYEDR ISMLLDDGDL GLDRYGGFMT 
AHEGMRGLTG AAESEEVEAH PHLGETLGRS DVRKYIPQSR EDGDNGGADW QDVRDEAELE 
AMRERGEFLD LWQWRAHRSH PLGYADNGYV LEYRHSSEGR GMFTDNWDDE ADQPRWMYDP 
DEAGFRALER DRLLDGAYDQ DDLYYLSEGH ATDFDPDHHW EDGDVLPQRF LQEPDGSRGA 
IRAAGGYEDG AWRVRLTRSL EAPEPTDSHT LEPGGVYDVA FAVHEGVGQR WHRVSLPQTL 
ALAEEAADAP EADIVATHTE GDLDDADVEW TEVGLIYPGQ MTWDWLTDRS PAGHPGAGHV 
IGGERAIGDE HRLPRLQDYL LYEERRRIDQ QD