Gene Hhal_0160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0160
Symbol
ID	4710589
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	186157
End bp	187671
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	65%
IMG OID	639854618
Product	hypothetical protein
Protein accession	YP_001001756
Protein GI	121996969
COG category	[S] Function unknown
COG ID	[COG3517] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03355] type VI secretion protein, EvpB/VC_A0108 family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.586065
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAGC AGACGAGCGC AGATAGGGCC GCAGAAGCCA CGGCCCCGGC GGCAAGCTAT 
GCGCACCTGT GCCAGCTGGC CGAGGTCGAG CCGGTCTCCG GCGCCCTGGA GATCGCCACC 
TTCCAGGACT CGGCGGTCAT GGCGGACATC CCCTCGGAGA GTCGATTGAC CGCTGCCCTG 
CAGGTGTTCC TGGATCTCGC CAGTCAGGAC GGCGAGCTGG TCGAGCGCAT CGACAAGGCG 
TTGCTCGACG AGTATATCGC CCGCATCGAC GCGGCGGTGA GCGAGCAGCT CGACGCCGTC 
CTGCACCATC CGGAGTTCCA GCGGGTGGAG TCGGCCTGGC GCAGCCTGCG TTTCCTCGTC 
GAACGCAGCG ATCCCAAGGC GAACATCAAG CTGGAGCTGC TCGATGTCTC CAAGGAAGAG 
CTGGCCGGCG AGCTCGAGGA TGTCACTGAC ATCACCCAGT CCGGCCTGTA CCAGCACGTC 
TATGTGCAGG AGTACGACAC CCCGGGCGGG GAGCCCTTAG CCGCCATGGT CTCCAACTAT 
GAGTTCGACT GCTCGGCGGC GGACATCAAC CTGCTGACCG AGGTATCCCG GATTGCGGCG 
GCGGCCCACT GTCCCTTCCT CGGTGCCGTC GGCCGGGACT TCTTCGGCAA GGCCTCCCTG 
GATGAGGTGG TCCGGATCCC GGATATCGCC AGCTATCTAG ATAAGGCCGA GTACGCCCGC 
TGGCGCGGGT TCCGCGACAC CGAAGACGCT CGGTACGTCG GCCTCACCCT GCCGCGGTTC 
CTGCTGCGCC TGCCCTACGG GGCCGACAAC CCCACCCGTG CGTTCGACTA CCGCGAGAAC 
GTCACCGGGG TCGATCACGA TCGCTACCTT TGGGGGAATG CAGCCTTCGC CTTTGCCGCC 
AACATGGCCC GTTCCTTCAA GGCCTACGGG TGGACGGTCA ATATTCGCGG GCCGGAGTCC 
GGCGGCAAGC TCGAGCAGCT GCCGATCCAC GTCTTCGACC TCGGCCGTGG GGCGCAGACC 
AAGACCCCCA CCGAGGTGCT CATCTCCGAG AACCGCGAAA TCGAGCTGGC CGAGGCCGGA 
TTCATCCCGC TGAGCTTCTA CAAGAACAGC GATTACGCCT GCTTCTTCTC GGCCAACTCG 
GCGCAGCGTC CGGCCCGCTA CAACAGTCCC GCGGCGACGG CGAATGCCCG GATCAACGCC 
CGGTTGCCGT ACATCTTCCT GGTCTCCCGT CTGGCTCACT ATCTCAAGGT GCTGCAGCGG 
GAGAATATCG GCTCGGCCAA GAGCCGGCAG GACCTGGAAA ACGAGCTCAA CGATTGGCTG 
CAGGGGCTGG TGACCAAGAT GCAGAATCCG GATCCCGATC TGGTCGCTAC CCGCCCGCTA 
CGCGAGGGGG TGGTGGAGGT CGAGGAGGTC CCCGAAAACC CGGGCTTCTA CCGGGTCAAC 
ATGTCGGTGA TGCCGCACTT CCAGATCGAG GGTATCGACC TGAAGCTCTC GCTGGTGTCG 
CAGTTGCCGA CCTGA

Protein sequence

MSEQTSADRA AEATAPAASY AHLCQLAEVE PVSGALEIAT FQDSAVMADI PSESRLTAAL 
QVFLDLASQD GELVERIDKA LLDEYIARID AAVSEQLDAV LHHPEFQRVE SAWRSLRFLV 
ERSDPKANIK LELLDVSKEE LAGELEDVTD ITQSGLYQHV YVQEYDTPGG EPLAAMVSNY 
EFDCSAADIN LLTEVSRIAA AAHCPFLGAV GRDFFGKASL DEVVRIPDIA SYLDKAEYAR 
WRGFRDTEDA RYVGLTLPRF LLRLPYGADN PTRAFDYREN VTGVDHDRYL WGNAAFAFAA 
NMARSFKAYG WTVNIRGPES GGKLEQLPIH VFDLGRGAQT KTPTEVLISE NREIELAEAG 
FIPLSFYKNS DYACFFSANS AQRPARYNSP AATANARINA RLPYIFLVSR LAHYLKVLQR 
ENIGSAKSRQ DLENELNDWL QGLVTKMQNP DPDLVATRPL REGVVEVEEV PENPGFYRVN 
MSVMPHFQIE GIDLKLSLVS QLPT