Gene Acid345_2503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2503
Symbol
ID	4069872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2959135
End bp	2960274
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	60%
IMG OID	637984520
Product	hypothetical protein
Protein accession	YP_591578
Protein GI	94969530
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.490414
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTGA ATCGAGGCGC AATGGTGCGC TTCTCCGCCG TCGCATCCGG AGTACTCGTC 
GCCGCGTCTG TATTGATCGC CGCGCGGCCC GCGCAGGCGC CACAAGGCGG GGGGACAAAG 
ACCGCCGTAC AGCAGTTCAA GAACATTCAG GTCCTCAAGG ACATTCCCGC CGACCAGTTG 
ATTCCGTCCA TGCAGTTCAT TGCGAACTCA TTGGGTGTGG AATGCGACTT CTGCCATGTG 
GAAGGCGCGT TCGATAAGGA CGACAAGGAA GAGAAGAAAA CCGCGCGCAA AATGATGGCG 
ATGATGATCA CCATCAACCA GGAAAACTTC GAGGGCAAGA AGGAAGTGAG CTGCAACACT 
TGCCATCGCG GTACGCCGCA TCCGCGGGGA GTGCCGGAGA TTCCGGAGCA AGCGAAGGCG 
GCGGTCAGCA CCGAGGAGAT GGAGAAGCAG CACCACGAGC ACAACGCCGA ACGGGGTTCG 
GCCGATCCGA TCATCAACGC CTATTTGAAG GCCGTTGGCG GTGCCGACGC GATTGCGAAG 
CTGAAGTCGG TGACAGAAAA GGCGAACATG GGGATGGGAC CGGGGCGCGC TGTTTCCGTG 
GAGATTTTCG AAGAGACGCC CGTCCGCCGC GTGTCGGTGG CGCATATGGG CGACAAGGAC 
AGCGTGACAG CCTACAACGG CGAAGACGGC TGGCTATCGT TCCCGGGGCG TCCGCTACGG 
CCGATGAACG GAGACGAGCA GTATGCCGCG AAGCTCGATG CGCAGTTCCT GGTGCCGAGC 
GATCCGCGTA AAGCCTTCGC CGAGATTCGT ACGGTGCAGG CCGATACGAT CAACGGGAAA 
GAGATGAACG TTGTGATTGG CAAGAACCCC GGGCAGGCGC CGGTTACGTT GTTCTTCGAC 
AAGCAAAGCG GCCTGCTGGT GCGCATGGTG CGCTATGCCG ATACGCCGCT GGGTCGTAAC 
CCGACACAGG TGGACTTCGC AGATTATCGC GACCAGAGCG GCGCGAAGAT CCCATTCGAG 
TGGACGATCG CACGACCGCT GGGACGGTTC ACCATGAAAG TGGATTCGGT GCAGGTGAAC 
GCGCCGATTG ACGCGAAGAC CTTCCAGAAG CCGGAAGCAC CGGCGGCGGC TGCGCACTAA

Protein sequence

MTLNRGAMVR FSAVASGVLV AASVLIAARP AQAPQGGGTK TAVQQFKNIQ VLKDIPADQL 
IPSMQFIANS LGVECDFCHV EGAFDKDDKE EKKTARKMMA MMITINQENF EGKKEVSCNT 
CHRGTPHPRG VPEIPEQAKA AVSTEEMEKQ HHEHNAERGS ADPIINAYLK AVGGADAIAK 
LKSVTEKANM GMGPGRAVSV EIFEETPVRR VSVAHMGDKD SVTAYNGEDG WLSFPGRPLR 
PMNGDEQYAA KLDAQFLVPS DPRKAFAEIR TVQADTINGK EMNVVIGKNP GQAPVTLFFD 
KQSGLLVRMV RYADTPLGRN PTQVDFADYR DQSGAKIPFE WTIARPLGRF TMKVDSVQVN 
APIDAKTFQK PEAPAAAAH