Gene Haur_3672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3672
Symbol
ID	5735533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4616105
End bp	4617241
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	38%
IMG OID	641280821
Product	hypothetical protein
Protein accession	YP_001546436
Protein GI	159900189
COG category	[R] General function prediction only
COG ID	[COG1106] Predicted ATPases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGAAC TTCAGCTTAA TTCATTAATC ATTCAGAATT TTCGGGGCTT CGAAAATTTT 
CAGATCAACC AACTTGGACG GGTAAACCTG ATTGTTGGTA AAAATAATAT TGGCAAAACT 
TCTCTGTTAG AGGCGATTTG GCTGTATGCC AACCGTGGTT CAAGCGTGAC AATCTACGAT 
ATTTTGAAAG ATCGCGACGA GCATCGGGTG TTTAATCTGA ACCCTACTAC CGAACAAACC 
CAACAAGAAA TTCTTGCCAT CAAAAATTTG TTTTATCAAC GCAATGACTT TACCGACCAG 
ACCCAAACGC TGCAAATTGG CAATACTCGC GAGAATTATC TCCAACTTCA GGCGCGTTGG 
TATCAAGTTG AGATGGATGA TCACGATAAT TTAACTCCCA AACCAATTAA ATATGCAGAT 
CTTGATTTTA GCGATGAGCC ATTTTTTGGT GTCGAAGTAG TAATGTATAG AAATGGTAAA 
TCCGCTCAAA AAATTAGAAA ATATCCAATC TATCGCCAAA ATCCTACCCA GAATTGGAAT 
GAAATTGTTT GTAACTTTAT TACATCAAAT TTTGTTCATC GCTATCAGCT TAGCAAATGG 
CGTGATACAA CCCTGATTGA AGGACTTGAG AATTATGCAC TTGAGGCATT GCAAATTATT 
GAACCTTCGA TTGAAGCGAT TAATATGATT ACGGTTGAAG AAAAAGTAAC AACCGATTTC 
TCGATAAGCT CAAGGTTGGT TCCCATTCCT GTGGTTAGAA TGGTCGGGGC AACCAAATTT 
ATTCCTTTGC GCAGCTTAGG CGATGGTTTG AATCGCATGC TGATTTTGAT TTTAGCAATG 
GTCAATGCCA AAGATGGCTT TGTATTAATT GATGAAATTG AAAATGGCCT GCACTATTCA 
ATCTATCCTA ATGTTTGGAA ATTGATTTTT AAGCTAGCTG AAACCCTAAA TGTTCAAGTA 
TTTGCGACAA CTCATAGCAA AGAATGTTTA AATGCCTTCA ATAAAACCAA TAAAGATCAA 
GCCGCTCAAT CAGGGCGATT AATTCGCTTG GGTCGCAAAA AAGGCAACAT CGTTGCAACT 
GAATATAATC AAAAAGATAT GCAAGTTATC CTCGAACGTG ATATTGAGGT ACGCTAG

Protein sequence

MAELQLNSLI IQNFRGFENF QINQLGRVNL IVGKNNIGKT SLLEAIWLYA NRGSSVTIYD 
ILKDRDEHRV FNLNPTTEQT QQEILAIKNL FYQRNDFTDQ TQTLQIGNTR ENYLQLQARW 
YQVEMDDHDN LTPKPIKYAD LDFSDEPFFG VEVVMYRNGK SAQKIRKYPI YRQNPTQNWN 
EIVCNFITSN FVHRYQLSKW RDTTLIEGLE NYALEALQII EPSIEAINMI TVEEKVTTDF 
SISSRLVPIP VVRMVGATKF IPLRSLGDGL NRMLILILAM VNAKDGFVLI DEIENGLHYS 
IYPNVWKLIF KLAETLNVQV FATTHSKECL NAFNKTNKDQ AAQSGRLIRL GRKKGNIVAT 
EYNQKDMQVI LERDIEVR