Gene Haur_2950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2950
Symbol
ID	5734822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3723119
End bp	3724324
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	54%
IMG OID	641280094
Product	hypothetical protein
Protein accession	YP_001545716
Protein GI	159899469
COG category	[S] Function unknown
COG ID	[COG3214] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCGGA CTATCTCGCT TGATCAAGCG CGGGCGATTG CAATTGCTGC CCAAGGCTTA 
GATCGTCGTC CCAACACTGT TGATCAAACC ACATTGCAAC AAACCATCCA GCGCATGCAA 
ATTGTCCAGA TCGATACGAT CAATGTGGTA GCACGTGCGC CCTACTTTGT GCTCTGGAGC 
CGTTTGGGTG ATTATGATCC TGCTTGGTTT GAGCAATTGC AATATCCGGC GGGTCAATTA 
TTTGAATATT GGGCACATGC AGCCTCGTTC TTGCCGATCG AATTATTTCC CTTGCTGCGT 
CCAGCGATGT TGCGCTATAT CCACGATTGG CACAGGTCGC GGCGTTGGCT CGAGGAAAAT 
AAGGCGGTGG CTGATGGTGT GCTGGCCATG ATTCGCGAAC GTGGCCCGTT GCGTTCAGCC 
GATTTTGAAG CCCCAGCCGA TCATGCTGGC GGTGGCTGGT GGAATTGGAA ACCAGCCAAA 
TCGGCGCTCG ATATCCTCTG GGGCATGGGC GAATTGATGA TTGTGCGCCG CGAGAAATTC 
CAACGGGTTT ATGAATTGAC CGAGCGGGTT GTGCCCGATT GGGATGATCG CGATGTGCTT 
AGTTTTGAGG CAGCCGCCGA GCAATTGAGT GAGCGTGGCT TGCGGGCGAT GGGGATTGCC 
ACCGAGCGGC ATCTGCCCGA TTACTTTCGC CAACGCCGAC CAGGCATCAA AGAACGCTTG 
CAAACTTGGG CGGCTGAAGG CAAGGCAATT GAGGTGCATG TGGAAGGTTG GAAAACTCCA 
GCCTATATTC ATCATGACCA GCGCCATTTG TTGGAGCAAA CACCCACGCC CAGTCTGACG 
ACGATGCTTT CGCCCTTCGA TAACTTAATT TGGGATCGCC AACGCACGCT GGATTTTTGG 
CAGTTTGACT ATCGGCTTGA ATGCTATACC CCAGCGCCCA AGCGACGCTA TGGCTATTTC 
ACCTTGCCAA TTCTCTGGAA AGATCGAGTA GTTGGGCGGA TTGATGCCAA GGCTGAGCGC 
AGTGCTGGGA TTTTTCGGGT GCATGCCCTG CATTTGGAAC CAAACATCGA GCTAAGCGAA 
GCTTTATACG ACGATCTGGC CGTGATGCTG CGTGATTGTG CCAATTGGCA TCGCACGCCA 
ACCATCAGCA TTACAATGAG CGATCCGCCG CAGGTGGCTG ACGAAGTGCA AGCCCGCGTG 
AGCTAG

Protein sequence

MTRTISLDQA RAIAIAAQGL DRRPNTVDQT TLQQTIQRMQ IVQIDTINVV ARAPYFVLWS 
RLGDYDPAWF EQLQYPAGQL FEYWAHAASF LPIELFPLLR PAMLRYIHDW HRSRRWLEEN 
KAVADGVLAM IRERGPLRSA DFEAPADHAG GGWWNWKPAK SALDILWGMG ELMIVRREKF 
QRVYELTERV VPDWDDRDVL SFEAAAEQLS ERGLRAMGIA TERHLPDYFR QRRPGIKERL 
QTWAAEGKAI EVHVEGWKTP AYIHHDQRHL LEQTPTPSLT TMLSPFDNLI WDRQRTLDFW 
QFDYRLECYT PAPKRRYGYF TLPILWKDRV VGRIDAKAER SAGIFRVHAL HLEPNIELSE 
ALYDDLAVML RDCANWHRTP TISITMSDPP QVADEVQARV S