Gene Hhal_0155 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0155
Symbol
ID	4710750
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	180465
End bp	182525
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	73%
IMG OID	639854613
Product	Rhs element Vgr protein
Protein accession	YP_001001751
Protein GI	121996964
COG category	[S] Function unknown
COG ID	[COG3501] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01646] Rhs element Vgr protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.91616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGGGA GTGCCAAGGA AGGCGGTGGC GCGCACGCGC TGTTTCGGGT GCGTCTACCG 
GGATTGGACC CGGACGTGCT GCGGGTCGAG CAGATTGTCG GTCATCAGGC ACTGGATGAC 
GGTGACCGTC TGCAGGTCCG GGTGTGTGGC CCGGTCGGGG ATCGGGTCCG GGAGTGGCCC 
GGGCAGCTGG TCGCGTTGAC CCTGGGTTGG GGGGTGGCGC CGCGAACACT GCACGGGGTG 
ATCAGCGAGG TGGCCCTCTG CGGGGGGGAG ATGTCCTCGC GGGCGGCGAC CCTGACCGTG 
TGCTCGCTGC TCCATCCCCT GGCCGGATCA TACCGGCGGC GGGTCTATCG GCGTTGTTCG 
GCCTTGCACA TGGCCCGCGA AGTCCTCCAG GGCGCGCTGC CCGACGGGGT GTCGGTCACC 
GTGGGGGTGG AGCGGTCCCT GCCGGAGCGG CCACTGGTCG TCCAGGGCGC TGCGGATGAC 
CTGGCCTTCC TGCGCCGGGT GTTGGCCCGG GAGGGGTGTT TCCCGGTGGT GCGGGATGCC 
GGTGGGCGGC CAGAGGTCCG CATCGTCGAT CATCTGGCGC AGGCCGAACT CGACGCGGCG 
GCGCTGACCT GGCGCCCGGG CGGTGGGCCG ACCCCGACCA CCCGGGCGAC CGTCTCCGAG 
GTCTCCCGCC GCTGGACGCT GCAGCCGGGG CAGGTGCGGG TCGGCGGTTT CGATCCGGCG 
TTGCCCGACC GCGGGCGTCC CGCCACGGCA GGCACCGACG CCGCGGAGGA CAGTCCGATG 
GAGTTGGGGC TCCACGGGGT CACGGCGGGT GGTGAGTCGG CCCATGCAGA GTGGGCCGAG 
GCCGTGCACG AGGCCTCCGC GGCCCAGCGC TGCCGTATCG AGGCGGTCGT GGCGACGCCG 
TTGCTGCCCG GGATGCGGGT GGTCATCTCC GGGCATCCGG AGGCTTCGCT CAATGGCGCT 
TACTGGGTCT ACCGCGCCGA GCACGAGGGG GACCAGGCCG CGGCGATTCA CGGCGGTGGT 
GGTGCGGATC GGGTGGACTA CCGGGGGCGG GTGGAGCTCC TGCCGCTCGA CCCCGGTTAC 
CGGCCGGCCC CGGTGCCTGC ACCCGCGATC CCGGGGGTCG CCGTGGCATG GGTCGCTGGC 
GGGGATCCGG AGCGCGCCGA GGTCGACGAG GCCGGGGCGT ACCGGATTCG CCTGTTCGAC 
GAGGCCGAGG CGGCCGATGG GGTCGAGGCA GCCCCACCGG GGCCGCCGGT CTGGGCCGTC 
CAGCCGAGCG CCGGTGCGCA GCACGGCCTG CACTTGCCCC TGCTGCCCGG GACGCGCGTG 
GCGGTGGCGG GGTTGCACGG CGACCTGGAA CAGCCAGTGA TCCTGGGGGC CCTGAGCAGT 
CAGGATCAGC CCGGTCCCGT GACGGACCGC AATCCCCACC AGCACCTGCT GCGGACCGCG 
GCCGGGCAGC GCCTGCTGCT GGACGACCGG CCCGGGGCCG AGGGGGCGGA GCTGGCCGTG 
GGCGAGGCCG CGCGACTGAG TCTGGAGGGG CACGAGGAGG CCCCCGGGGC AACGCTGGAG 
GCCCCCAACG GTTATCTCGA GCTGGCCAGC GGCGGAGAAC AGCGCGTGCG CAGCGGTGGC 
GATCAGCGGC TCGATGTGGC CGGGGCCTAT CGGGTGGAGG TCGAAGGGAG CTACCACCTG 
GAGACGGAGG ACGGCGCGTT GCACTGGTTT GCCGGCGACA CCCTGCATCT GGAGACCGGC 
GCGGGGGATC TGCTGCACGA GGCGCCAGAC GGGGAAGTGG CCCTGAAGGC GGGGCGTCAG 
GTGTCGCTGG ATGCGGGATC AGGATTGCGG TTGATCGCCC GACAGGGTGC GGGCGACTGG 
CAGGTTGAAT CGGGCGCGCT GCGCCTGGAG GCGGCCGGCG ACGTCGCCCT GGTCAGCACC 
GGGGGCGGCT GTCTGCAGCT CGGCGACGGC TTCGGGCTGC GCATCGAGGA CAGTGGTGCG 
GTCTATGTCG AGGGGCGGCA CATTGAGCTC AGCGCCGAGC AATTGGTGAT CGCTGCCGAC 
CGCATCGAGG AGGGGCGGTG A

Protein sequence

MKGSAKEGGG AHALFRVRLP GLDPDVLRVE QIVGHQALDD GDRLQVRVCG PVGDRVREWP 
GQLVALTLGW GVAPRTLHGV ISEVALCGGE MSSRAATLTV CSLLHPLAGS YRRRVYRRCS 
ALHMAREVLQ GALPDGVSVT VGVERSLPER PLVVQGAADD LAFLRRVLAR EGCFPVVRDA 
GGRPEVRIVD HLAQAELDAA ALTWRPGGGP TPTTRATVSE VSRRWTLQPG QVRVGGFDPA 
LPDRGRPATA GTDAAEDSPM ELGLHGVTAG GESAHAEWAE AVHEASAAQR CRIEAVVATP 
LLPGMRVVIS GHPEASLNGA YWVYRAEHEG DQAAAIHGGG GADRVDYRGR VELLPLDPGY 
RPAPVPAPAI PGVAVAWVAG GDPERAEVDE AGAYRIRLFD EAEAADGVEA APPGPPVWAV 
QPSAGAQHGL HLPLLPGTRV AVAGLHGDLE QPVILGALSS QDQPGPVTDR NPHQHLLRTA 
AGQRLLLDDR PGAEGAELAV GEAARLSLEG HEEAPGATLE APNGYLELAS GGEQRVRSGG 
DQRLDVAGAY RVEVEGSYHL ETEDGALHWF AGDTLHLETG AGDLLHEAPD GEVALKAGRQ 
VSLDAGSGLR LIARQGAGDW QVESGALRLE AAGDVALVST GGGCLQLGDG FGLRIEDSGA 
VYVEGRHIEL SAEQLVIAAD RIEEGR