Gene Haur_4544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4544
Symbol
ID	5736940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5814886
End bp	5816031
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	51%
IMG OID	641281706
Product	hypothetical protein
Protein accession	YP_001547303
Protein GI	159901056
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCAAAG AATTAACCGT GCGAGTGAGT GCCCGCACCG TCGGCTGGAC ACTGCTGATT 
TTTTCAGGGG TCTGGATTAC GATTCTGCTG AATCATGTGT TGGTGCTGTT TTTTGTGGCG 
GTGCTGCTAG CAGTGGCAAT TTCGGGGGTG GTGCAACGCT TTGAACAATT GCGCATCGCC 
CGCCCCATCA CAATTTTGGT GATTTATACA ATCATTATTG CGATGTTTAT TAGTTTGGGC 
TTTGTGCTAG TGCCAATGGT TAGTCAACAG GTGCGACTTC TGGCTGAGCA ATTCCCTAAT 
TTGGTGCGCC AACCAACCCA ACAAGCTAGC GCTTGGCTGG CCCAACAGTT TCCAACCTTG 
CGTGTACCCT TGCCCACTGG CGATTTGGCT GGTCAGGCGG CACATTACGC GGGTACAGTC 
GTTGGTGGGT TTAGTGGCGC AGCCTTCACT TTTGGGCGCA CCTTGATGGG TGTGATTATT 
AATTTTATTG TGGTGTTGGT TTTAGCTTTT TTCCTGGTTA GCCGCGCCAA TGTTGCCAGC 
AATTTTATCA AATTGATGAT TCCCAATCGC TTTCAAGAAC GCTTAATCAA TGTGACCAAT 
GTGATTGGCC GCCGCCTTGG GCGTTGGGTT TGGGCGCAAC TGACAGTTGC CACCTTCTAT 
GCCGTTTGTT TTGGTATGGG CTTGTGGATG TTGGGCGTAC CCTATCCGGT CGCCTTAGGC 
GTAATTGGCG GCATGCTTGA GCTAATTCCC TATGTTGGCG GTTTCGTGGC CACCATTCTG 
ACCATGCTCG TGGCCTTCAC GGTGCAGCCG ATGTTGGCGG TTTGGGTGCT GGTGTTGCAT 
TTGATTGTTG GCAATATTGA AGTGCATATC ATTGCGCCAA AAGTCATGGG CCACGCAGTC 
GAAACCCATC CAGTGATCAC GATTTTGGCC TTGTTTAGCG GGATCGAGCT TTTGGGGATT 
ATCGGCGGGG TGATTGCGAT TCCATTGGCG GTGGTTGGCC AAGCATTGGT TGAAGAATTT 
TGGATCAAAC GGATTCGTGA AGCCCAACCT GCGGCGGAGT CGCTAGCCGT TCAGGCTAAA 
GCTCCAATCG TGCGCCGAAC TCAATTGCGT CGCCGCCCCA CATTGCGCAA ACGTCAAGGG 
ATCTAG

Protein sequence

MPKELTVRVS ARTVGWTLLI FSGVWITILL NHVLVLFFVA VLLAVAISGV VQRFEQLRIA 
RPITILVIYT IIIAMFISLG FVLVPMVSQQ VRLLAEQFPN LVRQPTQQAS AWLAQQFPTL 
RVPLPTGDLA GQAAHYAGTV VGGFSGAAFT FGRTLMGVII NFIVVLVLAF FLVSRANVAS 
NFIKLMIPNR FQERLINVTN VIGRRLGRWV WAQLTVATFY AVCFGMGLWM LGVPYPVALG 
VIGGMLELIP YVGGFVATIL TMLVAFTVQP MLAVWVLVLH LIVGNIEVHI IAPKVMGHAV 
ETHPVITILA LFSGIELLGI IGGVIAIPLA VVGQALVEEF WIKRIREAQP AAESLAVQAK 
APIVRRTQLR RRPTLRKRQG I