Gene Haur_0356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0356
Symbol
ID	5732266
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	425466
End bp	426575
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	52%
IMG OID	641277479
Product	hypothetical protein
Protein accession	YP_001543135
Protein GI	159896888
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000129825
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTTAA CTCGCCGTTT ATTGCTCAAA AGTGTATTAA TTAGTGTGAT TTGCGGTGTA 
GCGCTGCTGC AATTATATCG TCAGCGTGTG CCACCAGCCT TTAATTTGCC TGCCGCTGCT 
AGTGTGCGAA CCCAGCACCC AATCGTTGGC GTTCATACCC GCTTGATGGG CTTGGATGAA 
CCAACGATTC GCCGAACCTT GCAGCAGGTA CGCGAAATGG GCGCAACCAC GATTATTGAT 
TTGTTTCCGT GGGCCGTGAT TCAGCCACGT TCAGCCAATA GCTACGAGTG GACGGGCAGC 
GATATGCTGA TTGCCCATGC CCAACGCCAA GGTCTGACCG TAATCGCTCG TTTGGATTTT 
GTGCCAGCTT GGGCACGTCC TGCCAACACC AGTGATCGCT ATCTCGACCC TGATCACTAT 
GCGGCCTACG CTGATTTTGT GGTGGCGTTT GCCCAACGCT ATGTGCCGCA AGGCGTGCAG 
GTATTGCAAA TTTGGAACGA GCCAAATCTA CGCTTTGAAT GGGGCGATCG TGCGCCTGAT 
CCGGTGGCCT ATGCTAATTT GTTGAAAGTT GTCTATCCGC GGGTCAAAGC AGTTGCCCCC 
GAAGCGCTCA TTACCTTGGC TGGGCTTGCC CCAGGTGGCC CAACTGGCCT GATCGATCCG 
CAAACACTGA GCGTCAATGA TTTGACCTTT CTTAAATTGT GTTTAGCTGA AAAACCGCCC 
TTTGATGCAG TTTCGGTGCA TGCCTATGGC TCGATTAATC CCGCTGAGCA AGCGCCAGAT 
CTCACAATTA CTAACTTTCG GCGCACTGAA TTAATTTACG ATTTGGTGCT AGCGGCGGGC 
TACGAGGTAC CGTTTTATAT CACCGAGGGC GGCTGGAACG ATCACGCCCG TTGGCCAAAC 
GCCGTGTCAC CACCAATCCG TGTGCAAAAT ACGCTTGCTG CGTATGCTTG GGCTGAGCAA 
CACTGGCCAT GGATGCACAC TGTGGGCTTT TGGCAATTTT CATTACCCAA TCTTACCTAC 
ACCTATGCCG ATAACTACAC CTTTGTCGCG CCCGATGGCA CACCCAAGGC GATTTATTAT 
GCAGTGCAAG CATTTACCCA ACAACCCTAG

Protein sequence

MRLTRRLLLK SVLISVICGV ALLQLYRQRV PPAFNLPAAA SVRTQHPIVG VHTRLMGLDE 
PTIRRTLQQV REMGATTIID LFPWAVIQPR SANSYEWTGS DMLIAHAQRQ GLTVIARLDF 
VPAWARPANT SDRYLDPDHY AAYADFVVAF AQRYVPQGVQ VLQIWNEPNL RFEWGDRAPD 
PVAYANLLKV VYPRVKAVAP EALITLAGLA PGGPTGLIDP QTLSVNDLTF LKLCLAEKPP 
FDAVSVHAYG SINPAEQAPD LTITNFRRTE LIYDLVLAAG YEVPFYITEG GWNDHARWPN 
AVSPPIRVQN TLAAYAWAEQ HWPWMHTVGF WQFSLPNLTY TYADNYTFVA PDGTPKAIYY 
AVQAFTQQP