Gene Acid345_0641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0641
Symbol
ID	4069579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	789389
End bp	790546
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	58%
IMG OID	637982647
Product	hypothetical protein
Protein accession	YP_589720
Protein GI	94967672
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.226637
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCGCT GCGAGGCCGC TCCCATAACA TGGAAGGGCC GACGCGCCTT TCGCCTTACG 
AACGGTACGG TCGAAATCAC AGTGCTCCTC GGCGGTGGAC ACATCGCAGA TTTTCGTCTC 
TGCGGCTCGC CCTACAACAC GCTGTTCGAG TCGCCGTGGT CAACGATCGA GCCCTCGCAG 
TTCAGCTCAC AACTACACTC CAGCTCGTAT GGGGACGGTC CGATCGGGCG CCTGCTTTGC 
GGTTACACCG GGCACGCGCT GGCGCTAGGG TATTTCGGCT TGCCGGACGA ATCCGAATCG 
AATCAAGGGC TGCCTTTGCA TGGCGAAGCA GTAGCCAGCG ACTGGAAAAT CTCCTACAGC 
AACGCGGACG ATGTAAGCGC GTCTGTCACG ATGGAAGCTT TGTTGCCCGT TTACGGTCTT 
CGTGCCGAGC GCACCCTTCT GCTTTCCGCC GGCGCATCCA CCGTTCACAT CGAAGAGCGC 
GTGACAAACG TGAAGCACTC TCCTCTCGAT TTCCAATGGG TCGAGCATGC AGCATTCGGA 
GAGCCGCTCT TCTCGGCAGG TGAAGCCAAA CTCTACCTGT CGGCGAATCA ATGTCGTACC 
TGGCCGTTAG GATATGAGGA TCGGGAGAGT CTTGTCGTGG ATCGCGACTT TGACTGGCCG 
CACGCGCCGT GGATCAAGGG CCACTTGGTC GATCTGTCTC TCCCATTTGA TAAGAATGGC 
ACTGGCTTTG TTGCTGCGCT TCTCACAGAG CCAGAACGAT CGAACGCATA CATCGCCGTG 
CACAATCGGC GCCTAGAACT CGCGGCCGGT TACGTCTTCG ACCGCTGCCA ATTTCCCTGG 
ATAGCTCTTT GGGAAGAGAA TTGCGCGCGA AGCTATCCGC CTTGGAATGG CGTCACCCGT 
GCACGCGGCG TGGAATTCGG GAATAGCCCT ATTCCGCTCG GCCTACAACA CGCAAAAGAG 
ATGAAGACGC TCTTCGATGT CCCCGTATTC AGCACAATTC AGGCTGGTGA AACGATCGCC 
ACGAGCTATC AAATCTTCGT CACTCCGATG GAGCGCGATT GGCCAGACAT TTCGGACCTT 
CGAGAAGAGT CGGGAAGCTT AGCCGTTCAC AGCCAGGACG GTCGTCTCGC AAGCATCCCC 
ACGAGCGGCA AACCCTGA

Protein sequence

MNRCEAAPIT WKGRRAFRLT NGTVEITVLL GGGHIADFRL CGSPYNTLFE SPWSTIEPSQ 
FSSQLHSSSY GDGPIGRLLC GYTGHALALG YFGLPDESES NQGLPLHGEA VASDWKISYS 
NADDVSASVT MEALLPVYGL RAERTLLLSA GASTVHIEER VTNVKHSPLD FQWVEHAAFG 
EPLFSAGEAK LYLSANQCRT WPLGYEDRES LVVDRDFDWP HAPWIKGHLV DLSLPFDKNG 
TGFVAALLTE PERSNAYIAV HNRRLELAAG YVFDRCQFPW IALWEENCAR SYPPWNGVTR 
ARGVEFGNSP IPLGLQHAKE MKTLFDVPVF STIQAGETIA TSYQIFVTPM ERDWPDISDL 
REESGSLAVH SQDGRLASIP TSGKP