Gene Haur_2178 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2178
Symbol
ID	5734065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2759833
End bp	2761854
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	50%
IMG OID	641279319
Product	coagulation factor 5/8 type domain-containing protein
Protein accession	YP_001544946
Protein GI	159898699
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00232015
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGT TGAGTAGGCT GATTATTGTT CTTGGTCTTA TTTGTAGTAT TTTTGCCCAA 
CATTCAGCAA CGCCCAAAGC CCAAGCTGCG TTTGGGGCTA GCGATTTTCT CAAGGCCAAC 
GGCGCGACAG TGCGCAATAA TTCTGGTAAT GGGGCAATCG TCACGCTCAA AGGCACCAAC 
CTCGGCGGTT GGTTGTTGCA AGAAGGCTGG ATGTCGCCCT TGGGATATCC CGCTTTACCG 
CGCACCAGCT GGACTGCCAG CGGATCAGCT GGTGGAGCTG CTGCCGCAAT CGATGGCAAT 
CCGGCCACGC GCTGGACGAG CAACGCTCCC CAAGCTAATG GTCAATGGTT CCAAGTCGAT 
CTTGGCGGCA ACCAAGCCGT CGAACGGGTG ACGATCGACG CTGGCTCCTC AACGGGCGAT 
TATCCGCGCC AATATCAAGT TCAGGCTTTT GTTAATAATG CTTGGCTCAC AGTTGGCAGT 
GGCAGCGGTA CAAGCCAAGT GGTAACCGTC CAATTCAATA ACACTCAAGT AACCCGCCTG 
ATTCGCGTAT TGCAAACTGG CTCAAGCGGC AGTTGGTGGT CAATTCACGA ATTCAATGCT 
CAAATTGCTG ATGAATTTAA TTTGCGCCAA GCCTTGACCA ACCGCTTTGG CACAAGCACT 
ACCGATAGCT TGATCAACGG CTACCAAGAT ACTTGGATTC AAGCCAGCGA CCTCGATACG 
ATTAAAGCTA TGGGCTTAAA CATGGTGCGC GTGCCGATTC ATTGGCTGGT GCTGATGAAC 
ACTAATGGCA CGATGAAATC GGATACTGAA TCGTTCCGCA AGCTCGATTG GCTGATTAGT 
GAAAGTAGCA AGCGCAATTT ATATGTGATG CTCGATTTGC ATGGCGCTCC TGGTGCTGCT 
TGTCCATGGC ATTCATGTGG TCAAACTGGC ACCAACCAAC TCTGGACTAA CCCAACCTAC 
CAAAATTGGA CGGTGCAAAT TTGGGAACGC TTGGCGACAC GCTATCGTGG TAACCCAACT 
GTGGCCGCCT ACGATTTGCT CAACGAGCCA TTGCTGAGCA ACGGCGCAGC CGAAAACGAG 
CAACAGGTGC GCCAAAAATT TGATTTCTTT GATCGTTTGT ATGATGCTGT TCGCGCCAAA 
GACCCCGATC ATATGATTGT GATGGCAGCT TTCTATGATT GGTACCAAGC GTTATCGCCT 
GCAACCTATG GCTGGACGAA TGTGATGTAT CAATTACACC ACTACAACTT TGATACGGTC 
ACTGATTGGA ATGTAACCAA TAATTTCATT CAAAGTGCCT TGGATAAATA CGCCACCTTC 
ACCAAGGATT GGAATGTGCC TGGCTTTGCT GGCGAATATT GGTTCTCAAC TCACTACGAT 
CTGTATGAAA AATTTATGTC TGGCTTGAAT GCCTTGAATG TTTCATGGAC CAACTGGACA 
TACAAGGTCA ATGGCGGCGG CAACTGGGGC TTCTATCAAA ACAATACCCA AGCCGTACCA 
GATCTATTAA ATGATAGTGC TGCCACGATC GCCGATAAAT GGTCACGCTT CAGCACCAAT 
TATTTCCAAC CAAACACCCA GTTTCAAAAT ACGGTGCGAG CTTATGCGCC GGAAGGTTCG 
TGGGTTGCGC TACAAGCTGG AGCCAATAAT AGCTATGTTA GCGCCGATAA CTATGGCAAC 
AATCCCTTGG TTGCCAATCG CCCAAGCATC CAAGGCTGGG AAAAATTCCG CATGATCACG 
AATCCCGATG GGACGGTTTC GTTTATGTCG CTGGCCAACA ACAAATATGT GGCCGCCGAT 
TTGAACAACG GTGGGCGCTT GATCGCCCAA TCACGCGGGG TATTGGGCTG GGAAAAATTC 
CGCCGCGTTG ATCTTGGCAA CGGAACCTTT GGCCTCCAAG CAATCGCTAA CAATAAATAT 
GTCACCACTG ATCTGAATAG TGGCTCGCCT ATGTTGATTG CCAATCGCGA TGCGATCGGC 
GGCGCATGGG AAGCCTTCAC CTTCGTTGCG ACTGCTCCAT AG

Protein sequence

MKKLSRLIIV LGLICSIFAQ HSATPKAQAA FGASDFLKAN GATVRNNSGN GAIVTLKGTN 
LGGWLLQEGW MSPLGYPALP RTSWTASGSA GGAAAAIDGN PATRWTSNAP QANGQWFQVD 
LGGNQAVERV TIDAGSSTGD YPRQYQVQAF VNNAWLTVGS GSGTSQVVTV QFNNTQVTRL 
IRVLQTGSSG SWWSIHEFNA QIADEFNLRQ ALTNRFGTST TDSLINGYQD TWIQASDLDT 
IKAMGLNMVR VPIHWLVLMN TNGTMKSDTE SFRKLDWLIS ESSKRNLYVM LDLHGAPGAA 
CPWHSCGQTG TNQLWTNPTY QNWTVQIWER LATRYRGNPT VAAYDLLNEP LLSNGAAENE 
QQVRQKFDFF DRLYDAVRAK DPDHMIVMAA FYDWYQALSP ATYGWTNVMY QLHHYNFDTV 
TDWNVTNNFI QSALDKYATF TKDWNVPGFA GEYWFSTHYD LYEKFMSGLN ALNVSWTNWT 
YKVNGGGNWG FYQNNTQAVP DLLNDSAATI ADKWSRFSTN YFQPNTQFQN TVRAYAPEGS 
WVALQAGANN SYVSADNYGN NPLVANRPSI QGWEKFRMIT NPDGTVSFMS LANNKYVAAD 
LNNGGRLIAQ SRGVLGWEKF RRVDLGNGTF GLQAIANNKY VTTDLNSGSP MLIANRDAIG 
GAWEAFTFVA TAP