Gene Acid345_3071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3071
Symbol
ID	4072635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3649614
End bp	3651305
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	61%
IMG OID	637985090
Product	hypothetical protein
Protein accession	YP_592146
Protein GI	94970098
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAAATCG CGCCAATCTC GCGACTCTCC CTCCTCGCCG ACTGCGGGCT GCTCCTCCTC 
GCACTGCATC TCCCCATTCA CGCCCAGGAA CAAGCCAATA CGCCGAGAGA TCTCGTTTAC 
AGCGGCCCAT GCAGACTCGG CGAAGCGCTG CCCGACACGC CGCGTTTTGA AGTGACCGGC 
GTCGTCCTGA ATAACGTCAC CGGATCGCCG ATCGAAGGAG CTACCGTCAA GCTCAGTAGC 
GAATGCATAT CCGACGAGCG CGCCCGCGCC ACCACAACCG ACGATGAAGG CAGGTTCACG 
TTCACCCACG TCCGCGGAAT GGATGCCTAC ATCACGGCCA CCTTCGGCGA GGCTTTCCCG 
GAGTGGAATG TTGGCCGCCG CGCCGACGAC CCGCTGAATC GCTACACGAT TGGCCCGCAC 
ACCGGAGTGA TTACCCTGCG CCTTGCGCCA CCCGCTTACA TCACCGGTGT CGTGCGCGGC 
GCAGACGGCG CTCCGCTCTC TCCGGCGATG GTAACTCTGC GTTGTCTCCG CCCGTGGGGC 
GGCTGGCCGC AACACGAGGG CTGCAGTTCG TCCAACGTGA AACCCGACGG GTCGTATCGT 
CTCGGCCCGC TGCTGCCCGG TCGTTATGCG GTCGTTATCG AGCCCGAGGT GGAATTCGGA 
AAAGCTCCTG CCCCTGATGC CGATGGCGTA ACCCGCAGCT ATGTGCCGGT GCGCCAGCCT 
GCGCTTACCG ACGACGAGAG TTGTCCCTAT TTCGATCTGA AGGAAGGCGA GCAGAAGCGG 
CTCGACTTTA AGCTCAAGCG CGAAGTGTTG CACCACATCA CGGGCGCGAT CACCGGCAAG 
TCTTGGACGA CCGTGAACGT CGTCGATCGC CTCGGCTCGC AATCTTATCC GGTGAAACTT 
CTGGCGCAGT GTTGCGAGTT TGAGGCATGG GCGCCAAACG GAAGCTTCCG GATAGTCGGC 
GACGGCAACC TCAAAGGCGA AGTCTCGATC AAGGTCCAGG ACGGTGATCT TTCCGGCGTG 
GCGCTCCCCG CACACTCCGA CGACCGCCTC ACCATCCCCA TCGAAGTCTC GAGTACTGCT 
CCGCCCAACG AGAACAGCGT TTGCCTGTTC GGCGAGACAG CTTGTGGCTT CTGGTACGCG 
AACTTCCTCC GCTTCAACCC GCAAGGTGAG TTTGACGTAG TGCTTCAATC CAGCATGAAC 
GGCAGCACGT CCGACGGAGT ACGACATGAG TCGGTCGAGG TTCCCTCCGG CAATTACGAG 
CTGATCGTTT CGACCACAGG CAACGTCTAC GCCCAAACCA TCTCATCGGG CGCGACAAAT 
TTGTTGCGCG AGCGTCTCGC CGTGAATCCG GGCGACATAC CCTCGCCCAT TCGCATCGTG 
CTCGCCGAAG GCGAAATCGT CACCGGCACA ACTCTGCGCA ACGGCAAGCC GGCACGCGCG 
TTCGTGTATG CCGTTCCCAG CGAGAACGAT GCTCGCGCTT TTCAGGGCGT CCCCAGCGAC 
GAGCATGGGC AGTACAAGCT TGAGGGGCTC GCGCCTATCC AATACCACTT CTTCGCTTCC 
GACGTGGAAC TGAACCTCGA CCTTCACGAT CCCGACGCAA TGCGCCCCTG GCTGCAATCC 
TCCGAGACGC GCAGCCTTGC ATCCGGGAGT ACCACGTCGC TAGATCTACA CGTGTTGACT 
CCTGCGAAGT AA

Protein sequence

MQIAPISRLS LLADCGLLLL ALHLPIHAQE QANTPRDLVY SGPCRLGEAL PDTPRFEVTG 
VVLNNVTGSP IEGATVKLSS ECISDERARA TTTDDEGRFT FTHVRGMDAY ITATFGEAFP 
EWNVGRRADD PLNRYTIGPH TGVITLRLAP PAYITGVVRG ADGAPLSPAM VTLRCLRPWG 
GWPQHEGCSS SNVKPDGSYR LGPLLPGRYA VVIEPEVEFG KAPAPDADGV TRSYVPVRQP 
ALTDDESCPY FDLKEGEQKR LDFKLKREVL HHITGAITGK SWTTVNVVDR LGSQSYPVKL 
LAQCCEFEAW APNGSFRIVG DGNLKGEVSI KVQDGDLSGV ALPAHSDDRL TIPIEVSSTA 
PPNENSVCLF GETACGFWYA NFLRFNPQGE FDVVLQSSMN GSTSDGVRHE SVEVPSGNYE 
LIVSTTGNVY AQTISSGATN LLRERLAVNP GDIPSPIRIV LAEGEIVTGT TLRNGKPARA 
FVYAVPSEND ARAFQGVPSD EHGQYKLEGL APIQYHFFAS DVELNLDLHD PDAMRPWLQS 
SETRSLASGS TTSLDLHVLT PAK