Gene Haur_2518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2518
Symbol
ID	5734396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3215545
End bp	3217095
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	51%
IMG OID	641279658
Product	glycoside hydrolase family protein
Protein accession	YP_001545284
Protein GI	159899037
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3507] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAACGCC GCTTTCACAA TCCAATCATG ACGGGCTTTT ATCCAGATCC AGCAATTTGT 
CGGGTAGGCG AAGATTATTA TCTGATTCAC TCGACCTTTG AATATTTTCC AGGTGTGCCG 
ATTCATCATA GCCGCGATTT AGTGCATTGG CAGCAAATTG GCCATATTTT AGACCGCCCC 
TCGCAGCTCA ACCTCGACGA AATTCATCCA TCAGCAGGAA TTTTTGCCCC AACTATCAGC 
TACCATGATG GCACGTTTTA CATGATTACC ACCTTGATTG CTGGCAAAGA GCGCCATGGC 
AACTTTATCG TGACTGCTCA ATCGCCAGCT GGCCCATGGT CAGACCCCTA TTGGCTTGAT 
GCTGATGGGA TCGATCCCTC GCTCTTTTTC GAGGATGGTC GGGCTTGGTA TGTGGGCAAT 
CGTGGCAAAG CCAACCCCGA ATACGAAGGC CAATGCGAAA TTTGGCTGCA AGAGCTTGAT 
TTGACCACGA TGCAATTGAT TGGTGAGCAA GCGGTGCTGT GGCGAGGAGC GCTCAATGGC 
GTGATTTGGA CGGAAGGGCC ACATCTTTAC AAAATTGATG GTTGGTATTA TTTGCTGATT 
GCCGAGGCTG GCACGGAATA CAATCATGCG GTAACGATTG CCCGCAGTAG CGAATTGACC 
CAAGGCTATA TAGGCTATCC CGCCAATCCA ATTCTGACCC ATCGCCAGCT TGGCCGTGAT 
TATCCAGTGA TGGGCACGGG CCATTCTGAT CTGGTGCAAA CCCAAAATGG CGAATGGTGG 
CTGGTGTTGC TGGCAATGCG CCCATATGGC GGCGGTTTCT ATAATCTTGG GCGTGAAACC 
TTCTTAGCTC CGGTTCAGTG GGAACAAGGT TGGCCGTTGA TTAGCCCTGG CACTGGCAAA 
GTTGAATTGA GCTACCCTGC GCCCGATTTG CCCTTGCAAC GCTGGCCAGT TCAAGCTGCC 
TGCGATCATT TTGATGGCGA CAATTTAGCC ATGCATTGGA TGTTTTTGCG CACGCCGCGT 
TCGCAATGGT GGAGCTTGAG CGAACGAGTT GGTTGGTTGC GCATGCAACT GCGGCCTGAG 
CAAATCAACC AAATGGTCAA CCCTAGCTTT GTTGGGCGAC GGCAGCAACA TATGAACTTC 
TTAGCGCAAA CTATGCTGGA GTTTCAGCCG CAACAGCCGC AAGAAGTAGC GGGTATGGTG 
CTGATTCAAA ATCATAACTA TCAGGTGCAA TTTGTAATTA CTGGCGAGCA GCAAGCCAGC 
CTGATTGTGT GTCGCAATGG TGAGCAAGAA TGTTTGGCGC AAGTGCCAAT CGCCAGCCAG 
CGCAACTATT TACGAATTGT GGCTTATGGG CAGGAATATA GCTTTTTTGT GGCCGAGCAG 
CCCGATGCAT GGCGGCCAGT CTTTGAAAAT CTTGATGGCC GCTTTTTGAG CACTCCGGTT 
GCTGGTGGTT TTGTGGGCAC AGTGATTGGT TTGTATGCCA GTAGCCAAGG CCAAACCAGC 
CAAACTGTGG CCGATTTCGA TTGGTTTGAA TATCGCGAAA TCGCCGAGTA A

Protein sequence

MQRRFHNPIM TGFYPDPAIC RVGEDYYLIH STFEYFPGVP IHHSRDLVHW QQIGHILDRP 
SQLNLDEIHP SAGIFAPTIS YHDGTFYMIT TLIAGKERHG NFIVTAQSPA GPWSDPYWLD 
ADGIDPSLFF EDGRAWYVGN RGKANPEYEG QCEIWLQELD LTTMQLIGEQ AVLWRGALNG 
VIWTEGPHLY KIDGWYYLLI AEAGTEYNHA VTIARSSELT QGYIGYPANP ILTHRQLGRD 
YPVMGTGHSD LVQTQNGEWW LVLLAMRPYG GGFYNLGRET FLAPVQWEQG WPLISPGTGK 
VELSYPAPDL PLQRWPVQAA CDHFDGDNLA MHWMFLRTPR SQWWSLSERV GWLRMQLRPE 
QINQMVNPSF VGRRQQHMNF LAQTMLEFQP QQPQEVAGMV LIQNHNYQVQ FVITGEQQAS 
LIVCRNGEQE CLAQVPIASQ RNYLRIVAYG QEYSFFVAEQ PDAWRPVFEN LDGRFLSTPV 
AGGFVGTVIG LYASSQGQTS QTVADFDWFE YREIAE