Gene Acid345_0335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0335
Symbol
ID	4070097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	365323
End bp	366744
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	57%
IMG OID	637982338
Product	hypothetical protein
Protein accession	YP_589414
Protein GI	94967366
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.603461
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAAT CTATTGCAGC ATTGGCGGGC ATCGCTCTCG CGGGCGCGGT CTTGTGGCTG 
CCCATCGTTC GTACCGTGCG CGCAGAGGGC CAACCTGCCG AACTGAAGAA GGCCTACCGT 
CAACCGGCGA AGAACGGCTG GACCTACGTT CACATCGAAG GCACGCCGCA TGAGCTCGGC 
TTCCAGAGTG GCTACCTGCT TGCGAATGAA GTTCAGGACA CTCTGCACGT CGTCCAACTT 
GAGGCCGCGC ACGACTATAA GAAAGACTGG CAATTCTTCC GCGATGCCGC GCAGAACATG 
ATGTGGCCGC ACATCGAGAA GGAATATCGC AACGAACTTC AGGGCATCGC CGATGGGGCC 
ACCGCGCATG GCGTGAAGAT AGATGTATGG GACGTGGTCG CAATGAACGC GGCGCTGGAG 
TGGAGCTACT ACGTCAAGGT CTACGACAAG CAGCACGGCA TTACCACGAC AGCAAAGCTC 
GGGACGCCGG AGCACTGCAG CGCCTTCGTC GCGACCGGCA AATATACGAA GGACGGCAAG 
GTCGTTATCG CCCACAACAA CTGGACGACC TATCTTGAAG GCGAGCGCTG GACGATCATC 
TATGACATCC AGCCTACGAA TGGCAAGCGC ATGCTCATGG ATGGTCTGCC GGGCTTCATT 
CACAGCGCCG ACGATTTCGT TGTGAACTCT GCGGGTATCG CGATCACCGA GACTACGATC 
GGACACTTTG AAGGCTACGA TCCGAACGCC ATCCCCGAGT TCGTGCGCGC ACGTAAAGCC 
GCACAGTATG CAACGAACGT TGATGATTTC GCCCGCATTA TGAAAGACGG CAACAATGGA 
GGCTATGCGA ATGCCTGGCT CGTTGCCGAT GAGAGAAACA ACGAAGTCGC CCGCCTTGAG 
CTTGGCTTGA AAAACGTAAC GTTGGAACGC ACGAAGGATG GATATTTTGT GGGATCAAAC 
TTCCCGATCA ACGAGAAGCT GATCAAGGAA GAAGCGTCGA GCTACGACGT GAACAACATG 
AGTGAGAGCT CGAATGCTCG CCACGTGCGA TGGGAACAGC TCATGGCAGA GAACAAGGGC 
AAAATAGATC TCGCCGCCGC GCAAAAATTC GAAGCCGATC ACTACGACAC CTTCGAGAAG 
AAAGAAGACC CCGATGAGCG CACGCTGGAC GGGCACATCG AGCTTTCGCC GCGCGGATCT 
GGCGATTGGG TGCCGCCGTT CGGTACCGCC GGTGCGGTGC AGAACAAAGC CGCCGACTCC 
GGGATGATTG CCAAGATGAG CTTCTCGGCA GCAGCGGGGC ACGCGTGCGG GAAGGACTTC 
AAGGCCGCCG ACCATCTCGC GAAGCATCCG GAATACGACT GGCAGAAGCC ATTGCAGCGC 
GACATGGATG CATATCCGTG GACGACGTTC GCGTCGAAAT AA

Protein sequence

MRKSIAALAG IALAGAVLWL PIVRTVRAEG QPAELKKAYR QPAKNGWTYV HIEGTPHELG 
FQSGYLLANE VQDTLHVVQL EAAHDYKKDW QFFRDAAQNM MWPHIEKEYR NELQGIADGA 
TAHGVKIDVW DVVAMNAALE WSYYVKVYDK QHGITTTAKL GTPEHCSAFV ATGKYTKDGK 
VVIAHNNWTT YLEGERWTII YDIQPTNGKR MLMDGLPGFI HSADDFVVNS AGIAITETTI 
GHFEGYDPNA IPEFVRARKA AQYATNVDDF ARIMKDGNNG GYANAWLVAD ERNNEVARLE 
LGLKNVTLER TKDGYFVGSN FPINEKLIKE EASSYDVNNM SESSNARHVR WEQLMAENKG 
KIDLAAAQKF EADHYDTFEK KEDPDERTLD GHIELSPRGS GDWVPPFGTA GAVQNKAADS 
GMIAKMSFSA AAGHACGKDF KAADHLAKHP EYDWQKPLQR DMDAYPWTTF ASK