Gene Acid345_0535 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0535
Symbol
ID	4069993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	659452
End bp	660660
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	59%
IMG OID	637982540
Product	hypothetical protein
Protein accession	YP_589614
Protein GI	94967566
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.492189
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCGAA AGTCATTAAC CGTTATCGCC GTCTGTCTTC TTCCTCTCTC TGCATCCCTT 
GCGCAGACCA CGCCACCCTC CTGTCACTCA GCAGCCGCCG GACAAAACGG TAGCCTCGCC 
GGCTACGTGC CCTTTGGTCC GAGCAGTCCT TGGAACCAGG ACGTCTCTAA GGCGACGGTG 
GATCCCAACT CATCGGCGAT TATCGGTTAC GTTGGGACGA CGAAGCCTCT CCATCCGGAC 
TTCGGCGCTG GCCTCTATCA AGGCTCAACC ATGGGCATCC CATACATCGT CGTGACCTCC 
GCGACGCCGA ATGCCACCAT CCATTTCACG GATTCACCCG GCGAAAGCGA CCCGTCGCCG 
ATGCCGGTTC CGAAAACTGC ACCGATTGAG GGTTATCCCG CGCCAGGCAG CGGCGATCGC 
CACGTGCTCG TACTCAACAC CACGACTTGC TGGCTCTACG AGCTTTACTC CGCCTATCCC 
AACACCGATG GAAGTTGGAA CGCCGGGTCC GCCGCAATCT TCGATCTGAG CACTACTGCT 
TATCGTCCCT GGGGATGGAC GTCCGCCGAT GCTGCTGGCC TTCCTATCTT CGCCGGCCTC 
GTCCGCTACG ACGAAATCGT GAACGGCCAC ATTGATCACG CATTGCGATT CACGCTGCAT 
AACAGCAAGC AGGCGATGAT CTCGCCCGCG CGTCACTGGG CTGCGAATTC GTCGGACACC 
CTCGCCGCGC CCATGGGCCT GCGTTTCCGT CTCAAAGCCA GCGTGGACAT TTCGAAGTAC 
TCCAAGACCA ACCAGATCAT CCTCACCGCG CTGAAGAAGT ACGGCATGAT CATGGCCGAC 
AACGGCACGA GCATGTACCT GAGCGGCACA CCCGACGATC GCTGGAGCAA TGACGATCTG 
CACAACCTCA CCCAACTCAC CGCTAACGAT TTCGAAGTCA TCAAGCCAAC TGCGGTTTAC 
ACGACCCTTC CAACCGGCGC ATCGCCGGTC ATCACCAGTT TCACCGCGTC GGCTTACAGC 
ATCACCGCCG GAACCAAAGT GACATTGAGT TGGGCTGCGA CCGGCGCCAC CTACTACAGC 
GTCGCGCCAC TGGGCATGCA GCGCGGCACG TGGATGACCG TCGCTCCTAC GAAGACCACC 
ACCTATACGC TCTACGCGAC CGGTTCGTAT GGAAGGACGC AGGCGACTTT GACAATCACC 
GTTCACTAG

Protein sequence

MLRKSLTVIA VCLLPLSASL AQTTPPSCHS AAAGQNGSLA GYVPFGPSSP WNQDVSKATV 
DPNSSAIIGY VGTTKPLHPD FGAGLYQGST MGIPYIVVTS ATPNATIHFT DSPGESDPSP 
MPVPKTAPIE GYPAPGSGDR HVLVLNTTTC WLYELYSAYP NTDGSWNAGS AAIFDLSTTA 
YRPWGWTSAD AAGLPIFAGL VRYDEIVNGH IDHALRFTLH NSKQAMISPA RHWAANSSDT 
LAAPMGLRFR LKASVDISKY SKTNQIILTA LKKYGMIMAD NGTSMYLSGT PDDRWSNDDL 
HNLTQLTAND FEVIKPTAVY TTLPTGASPV ITSFTASAYS ITAGTKVTLS WAATGATYYS 
VAPLGMQRGT WMTVAPTKTT TYTLYATGSY GRTQATLTIT VH