Gene Hhal_0517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0517
Symbol
ID	4709646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	589419
End bp	590675
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	65%
IMG OID	639854975
Product	flagellar basal body FlaE domain-containing protein
Protein accession	YP_001002106
Protein GI	121997319
COG category	[N] Cell motility
COG ID	[COG1749] Flagellar hook protein FlgE
TIGRFAM ID	[TIGR03506] fagellar hook-basal body proteins

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATTCA ACATCTCGCT TACCGGGATC AACTCCGCCT CCAAGGATCT GGAGACCACC 
AGTAACAACC TGGCCAACGC CGGTACGACG GGCTTCAAGG AGTCCCGGGC CGAGTTCAAT 
GACCTCTTCG CCATGGGGCC GATGGGTATC CCGCAGCTGG CTGTCGGACA GGGCTCGCGG 
CTGGCCAATG TCGGCCAGAT GTTCAGCCAG GGGTCCTTCG ACTTCACGGA GCGCAGTCTC 
GACCTGGGCA TCGAGGGGCG CGGCTTCTTC CGCATGGAGG ACGATGGCGA GGTGAGCTAC 
ACCCGGGCCG GTCAGTTCGA GGTGGACCGT GACGGCTACA TCGTCAACAA CACCGGTAAG 
CGCCTGACCG GTTTCCAGAC CGACGAGGAC GGCAGTCGCA TCGGCGATGG TCGCGACCAG 
CTCCAGCTAC CCACCGACGG CATTCCGGCC CGGGCTAGCG AGAACGTCGA GATTGCGGCC 
AATCTCAGCG CGGACGCCGA CGTGATCGAC GAGGGGGTGG CCTTCGATCC GGACGACAAC 
GAGACCTTCA CTGAGTCCAC AACGACCACG CTCTACGACT CCCAGGGATC GGCCCGGGAT 
GCGACCTTCT ACTTCCGCAA GGTCGGCAAT AACGAGTGGG ACGTCTACAC CCAGGTCGAC 
GGGGTGGACT ACGAGCAGGC CGATACCGAG GGCGACTACT TCGGCCCGCA CCGGCTCTCC 
TTTGATACCT CCGGGTCCCT GGTCGATGCC GAGGGCGATG ACGAAGGGCG GATCGCCAGC 
CTCGAGGATG TCCCGCTGCT CGCCGAGGTG GACGACCTGG ACCTCGACAT CGACTTCGGT 
GAGATGACCC AGTTCGCCCG GCCGTTCAAC GTCACCAACG TCTCCCAGGA CGGCTACGCC 
GCCGGGGAGT TCGAGAACAT CAACGTCGAG GGCGACGGCA CCATCCTGGC CCGTTACAGC 
AACGGCGAGG CCCAGGCCGT GGGTCAGGTG GCGCTGACCA GCTTCCCGTC GGAGGAGAAG 
CTCCAGTCCG TCGGTGAGAC CTCCTGGCAG GCCACCCGCG ACGCCGGCGA TCCGCTGATC 
GGTGTCCCCG GCCAGGGGCA GTTCGGTCGG GTGGAGAATG GCGCCCTGGA GCAGTCCAAC 
GTGGAGGTCT CCGATCAGCT GGTGAACATG ATCACCGCGC AGCGCAACTT CTCCGCCAAT 
GCGCAGATGG TCAGCACCCA GGACCAGGTG ACCCAGGAGA TCCTCAACAT CCGCTAA

Protein sequence

MSFNISLTGI NSASKDLETT SNNLANAGTT GFKESRAEFN DLFAMGPMGI PQLAVGQGSR 
LANVGQMFSQ GSFDFTERSL DLGIEGRGFF RMEDDGEVSY TRAGQFEVDR DGYIVNNTGK 
RLTGFQTDED GSRIGDGRDQ LQLPTDGIPA RASENVEIAA NLSADADVID EGVAFDPDDN 
ETFTESTTTT LYDSQGSARD ATFYFRKVGN NEWDVYTQVD GVDYEQADTE GDYFGPHRLS 
FDTSGSLVDA EGDDEGRIAS LEDVPLLAEV DDLDLDIDFG EMTQFARPFN VTNVSQDGYA 
AGEFENINVE GDGTILARYS NGEAQAVGQV ALTSFPSEEK LQSVGETSWQ ATRDAGDPLI 
GVPGQGQFGR VENGALEQSN VEVSDQLVNM ITAQRNFSAN AQMVSTQDQV TQEILNIR