Gene Acid345_0381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0381
Symbol
ID	4069008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	432546
End bp	433667
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	52%
IMG OID	637982384
Product	hypothetical protein
Protein accession	YP_589460
Protein GI	94967412
COG category	[S] Function unknown
COG ID	[COG2357] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0160658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.52247
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAATG ACGAAAACAG CACCGACCGA GTTGATGTCG AAGAGGTGAT GCGGCAGTTC 
GTCGAAAAAC GAGATTTGCT GGAGGCGTTT CGTTCAAAGA CAGAGGGTTT AATCTCCGAA 
TTGTTAGACG CCGCCGCCAT TCGGTGCCAA TCAATTCAGT CGCGGGTCAA AACCAACAAG 
AAACTTCGGG CGAAATATCT TGACCCGAAG AAGGATTATC GCTCCCTCGA CGAGATCACA 
GACCAGGTTG GCTTTAGGAT CATTGTCTAC TATCAAGACG AGATTGATGT AGTCGCCAAA 
TTGGTCCGGG ACGAGTTCGA TGTGGATGAA GCGAATTCGG TCGACAAACG AATCACCGAC 
CCCGAACGTT TTGGCTATCA GGCGGTGCAC TGTGTTTGTC AGCACTCGTC TGGACGTTCC 
AAGATCACGG AATACAAGAA ACATGCGGGG ATCACGTGCG AGATCCAGAT TGCCACGATC 
CTCGGCCATG CTTGGGCCGA AATGGAACAT GAGTGGTACG ACCTGCAGGA TGATTTTCCA 
GACGATATCA AACGAAAGTT TTCGCGATTG GCTGCGCTCC TGGACCTTGC GGATTCTGAG 
TTCTTGGACA TCCGTAAAAA GAAGAGCAGC TATGAGCGAT CGGTAGAACT TCGGATCGAA 
GCAAACGTTC CCGATGTCCC GCTCGATTCC GTGTCTTTGA AATCGCTGTT AACTCAGGAC 
CCCCACGTGA AGGAAGTCGA TAGTAAGCTG GCAGTGATTT TCGCCAGCGA ACTAGTTCCA 
GATCTGTCCG ACGCCGAAGC TCGTCGGAGA TTCCCGATAA TGGAGTTCCT CGGGTTGCAG 
AGCGTCCGGT CGGCGCAAGA CAAACTCAGA CAGCACGAAG CGGCACTGTT GGAATTCGCT 
ACATTGTCCG AGCAGGGAGT TTGGCGCGAT TGGAAGCTCA AGACACCTAT CATGCCTGGT 
ATAGGGTTTT ACCACCTGAT GTTGTTATTC GCGTTCTCCG GAGGCCTAGA GTCTGCCCAA 
GTGGCTCTCG CGAAACTCGG AGGGGGGCTG AAAGGTTACC CGCACCTTGA CGAGCAAGTA 
AGGATCGCGC AAGCGGTAGC GAAAAAATAC GGGCTCACCT AA

Protein sequence

MANDENSTDR VDVEEVMRQF VEKRDLLEAF RSKTEGLISE LLDAAAIRCQ SIQSRVKTNK 
KLRAKYLDPK KDYRSLDEIT DQVGFRIIVY YQDEIDVVAK LVRDEFDVDE ANSVDKRITD 
PERFGYQAVH CVCQHSSGRS KITEYKKHAG ITCEIQIATI LGHAWAEMEH EWYDLQDDFP 
DDIKRKFSRL AALLDLADSE FLDIRKKKSS YERSVELRIE ANVPDVPLDS VSLKSLLTQD 
PHVKEVDSKL AVIFASELVP DLSDAEARRR FPIMEFLGLQ SVRSAQDKLR QHEAALLEFA 
TLSEQGVWRD WKLKTPIMPG IGFYHLMLLF AFSGGLESAQ VALAKLGGGL KGYPHLDEQV 
RIAQAVAKKY GLT