Gene Acid345_1017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1017
Symbol
ID	4069841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1279915
End bp	1281051
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	57%
IMG OID	637983024
Product	cell surface receptor IPT/TIG
Protein accession	YP_590094
Protein GI	94968046
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0346067
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCA AATTCGCGGT TCTCTGGGTA TATCTAGCCT GTGCACTTCT ACTTGGCAGT 
TTGATCAGTT GCGGCGGCGG TGGTGGGGGC GGTAACTCAG GAGGAGGCCT GACTCCTGTA 
GTTCCATCGA TAACAGCGGT CTCGCCAACG GATGCACTGG TCGGGCGGTC TGACTTCCAT 
CTCGTGGTAA ACGGCGCGAA CTTCTCCTCG GCTGCCGTGG TGTTATGGAA CTCCAATCCG 
CTCGCGACCA CGTTTGTTAA CTCCGGAAAG ATCCAGGCAG ACGTTCCAGC AACGTCGCTG 
ACCGTTGGCG TGGCCGTAAA ACTGAGCGTA AAGAACGGCG ATACAGGGAA GGTGAGCGCC 
TCGTTCGAGT TCGATGTGTA CAACCCAGCG CCAACACTGA CTTCAATTTC GCCGACGAAC 
GCGAAGATGG GATTGCCGGT GACGATTACG GTCACAGGGT CCGCCTTTGT CAGCAACTCG 
CAGGTGCAGT GGAATGGGAC AGCGGTGGCG ACAACGTTCG TGAGTTCCAC GCAACTCACG 
GCGGACATTT CGGCAGCGCA ATTGGGAAGT GCCACTCCGG GATCGATCAA GGTATTTAAT 
CCCGGACCAC GGGGAGGGAC ATCGGAAGGG CAGACTCTGC TGGTGGTGAA CGCCGCAACG 
ACAATCACGA CGCTCGACGT GAGCGCGACC GCAATCGTGA ATGATCCGAC ACACGGGAAA 
CTGTATGCAA CGGGAGCATT CGATGGGTCA AATTATGGCG TATTGGCAAT TGACCCGCTG 
ACGGGCGCCG CAGGAACCTC GCAACCGGTA ACGGGGCCAA CCAGCCAGTT GGCGCTGTCT 
TCGGACGGCT CGTATTTATG GATAGGAGGA CGGGACAACA ACCTGATCCA AAGAGTGACG 
CTTCCGGGAT TTGCGCCGGA CGTTACGATT ACGATTCCGC CCAACCATTT AGGCGAAAAG 
ATGTTTCCGT TGTCGATGGC TGCGGCGCCT GTGGGTTCGC ACGCGCTGGC GGTTATGCGG 
AGCAATTATT CGACGGGAGC GGATTCGCTC GGTGTCATCT ATGACGATGC GACGCCGAGA 
GCAAACGCAA TCACGCCCGG AACCTACACG GTTGCCGGAG TGACCTGGCT GACGTAG

Protein sequence

MKTKFAVLWV YLACALLLGS LISCGGGGGG GNSGGGLTPV VPSITAVSPT DALVGRSDFH 
LVVNGANFSS AAVVLWNSNP LATTFVNSGK IQADVPATSL TVGVAVKLSV KNGDTGKVSA 
SFEFDVYNPA PTLTSISPTN AKMGLPVTIT VTGSAFVSNS QVQWNGTAVA TTFVSSTQLT 
ADISAAQLGS ATPGSIKVFN PGPRGGTSEG QTLLVVNAAT TITTLDVSAT AIVNDPTHGK 
LYATGAFDGS NYGVLAIDPL TGAAGTSQPV TGPTSQLALS SDGSYLWIGG RDNNLIQRVT 
LPGFAPDVTI TIPPNHLGEK MFPLSMAAAP VGSHALAVMR SNYSTGADSL GVIYDDATPR 
ANAITPGTYT VAGVTWLT