Gene Haur_4040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4040
Symbol
ID	5735902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5157032
End bp	5158174
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	50%
IMG OID	641281191
Product	cell cycle protein
Protein accession	YP_001546800
Protein GI	159900553
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG0772] Bacterial cell division membrane protein
TIGRFAM ID	[TIGR02210] rod shape-determining protein RodA

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.283521
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCACTA GCATTCGCGC TCGTTCTTGG CGCGAGTTTA ATCCAATTAT GGTTGTTGCG 
GTCTTGCTCT TGCTGGCAAT TAGCGTACCA ATGGTCTATA CAACCACGGT TGGAGCCGCC 
GGAACCTTGG TGTTTGGGCT AGGTTCTTCG TTTGCTAAAC ATATTGTCTG GGTCAGCATG 
GGCATTAGTC TGATGTTTGG TCTGGCCATG GTCGATTATC AATTGCTGCG TTCGTTAGCG 
ATTGTTTTAT ATATCGCTGC GCTTGGGCTT TTGGGCATGG TGGTGGCGTT AGGCCAAGTT 
AAATATGGTG CGCAAAGCTG GATCGGCTCA AGCCAACTTT CGTTTCAGCC AACCGAGCCA 
GCCAAACTGA TGGTGATCAT CGCGCTTGCC GCATTTTGGA GCAAGCATGG CGATGAGCCT 
AGCCCTTGGA AATCGGTCTT TATCTCGTTG GGAATTTTAG CCGTACCCCT TGGCTTGGTT 
ATGCTACAGC CTGATTTTGG CTCAGGCATG GTGATGATCG GCATTTGGCT AGTGATGTCG 
TTGGTTGCCA ATACCCGTTG GGTACAATAT GGCATCTTGA CCCTGTTCAG TGCGCCGGTG 
GTCGTCTTAG CATGGCTCAA ATTTGATGAA TATCAACGCG AACGCTTGAC CGTGTTTCTT 
ACTCCTGAGC GTTGCGAAAC CGATTTAGAG TTTCGGATGC GAGCATGTTG GCAAATTATT 
CAATCGCGTT TGGCAATTGG CAATGGTGGC CTTGGCGGCA TGGGCTTGTT GCGCGGGGTG 
CAAAGCCAAT TGAACTATTT GCCCGTTCAA GAGAGCGACT TTATTTTCGC GGTTACGGCG 
GAAGAGTTAG GCTTTATTGG CGCGGCAGTC GTGATTGTGT TGCAATTAAT CATCATCTGG 
CAAATTTGGC GCGTAGTTGA GCGAGCACGT GACCCTTTTG GGCGTTTGAT GGCGGCTGGG 
GTTGCTGGCC TGTTGTTGGT GCATTGTCTC GAAAATATGG GCATGAACTT GATTATGATG 
CCCATGACTG GAATTCCGCT GCCTTTTCTG AGCTATGGTG GCTCGTTTAC CCTGACGGTT 
TTGATGGGCA TCGGTGTAGT GCTAAGCGTC TCGATTCGCA GTAAACGTTG GTCATTTAAT 
TAA

Protein sequence

MSTSIRARSW REFNPIMVVA VLLLLAISVP MVYTTTVGAA GTLVFGLGSS FAKHIVWVSM 
GISLMFGLAM VDYQLLRSLA IVLYIAALGL LGMVVALGQV KYGAQSWIGS SQLSFQPTEP 
AKLMVIIALA AFWSKHGDEP SPWKSVFISL GILAVPLGLV MLQPDFGSGM VMIGIWLVMS 
LVANTRWVQY GILTLFSAPV VVLAWLKFDE YQRERLTVFL TPERCETDLE FRMRACWQII 
QSRLAIGNGG LGGMGLLRGV QSQLNYLPVQ ESDFIFAVTA EELGFIGAAV VIVLQLIIIW 
QIWRVVERAR DPFGRLMAAG VAGLLLVHCL ENMGMNLIMM PMTGIPLPFL SYGGSFTLTV 
LMGIGVVLSV SIRSKRWSFN