Gene Acid345_2372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2372
Symbol
ID	4069184
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2803184
End bp	2804743
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	60%
IMG OID	637984388
Product	ankyrin
Protein accession	YP_591447
Protein GI	94969399
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.684572
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACCAC GGGAACTTCC CGCGCGCCCA AACCTAGAAC ATCTGAAAAA ACAAGCCCGC 
ACGCTGCTGC AGGAAGCACA GTCGTCGGAA CCAAGCGCCA TGGCGCGATT CACGGAGGTC 
AGCGTGGCCT CGTCGGCGCC GAAATTAGCC GATGCACTGC ACGTGATCGC GCGCGAGTAC 
GGCTTTGAAA GCTGGCCGAA GCTAAAGTTG CACGTCGAGT CGAATTCGGA GGATGCGGGC 
CTGGCGTTGA CGGCCGCAAT CAGGGCGAAC GACGCGAAAC TCGTGCGCTC GGTACTAGAA 
CGCCATCCGT CGCTAACGAA GCAGATCAAC GAGCCGCTGA CCCACTACAG CTTCGATATC 
CCCCCAATTG TGGCAGCGGC CGAGCGGGAG AGTCGTGAAG TGGTGGATGT GTTGCTAGCG 
GCCGGAGCGA ACATCAACGA GCGCTCGCGA TGGTGGGCAG GGAGCTTCGG CGTCCTTGAT 
TTCTGCGGTT CAGAGTTGGC GGAATACTTG ATCTCGCGCG GCGCAACCCT CGACATCCAC 
TCCGCCGCGC GACTTGGAAA GGTCGATGAG GTTCGCGCTA TGCTGGCGCG CGATCCGCAA 
CTCGTCCATG CGCGTGGCGG TGATGGGCAA TTGGCATTGC ATTTCGCGGC GACTGTCGAG 
ATCGCAGAGC TGCTGTTGGA ACATGGAGCC AAGGTTGATG TTCGCGACAT TGACCATGAA 
TCCACTGCTG CGCAGTACAT GGCTGGTTTC GGCCGTTACA GGAATTCGCC GAAATCCGAT 
CGGCACGACA TCGTTCGCCT CCTGATTTCG AAGGGCGCCG AGACTGACAT TCTGATGGCC 
TCCGCGATTG GCGATCGCAC GCTTGTTGAA GAAATCCTGA ACAACGATCC GGACACCGTG 
CGAGTGATCG TGAACGAGAA GCACCTTCCG AAGCGCGATC TGAAGTCCGG AGGGATGATT 
TACTTTTACG GTTTTGGGAT GACCAAGACC CCGCATATGA TCGCGCTAGA CTTCGGTCAT 
CGCGATGTCT TCGAACTGCT CATGCAACGT AGCGCGCCGT GGTTGCGCTT GTCGCAAGCT 
GCGGAGGCAG AGGAAGAATC TCTCGTAAGA GAACTGGTCC AGAAGCATCC CGCGATGATG 
GCCAAGCTGA CGCCGAATGC CGCGCGACGC ATCGTTGGTC CGGCGGTTCG GGGCAATACG 
CGCGCAGTAG AGTTGCTCCT CGAATGCGGG TGGCCTGCGA ACGCGACGCT CGACAACAAT 
CAGACTGCAC TTCACTACGC CGCATGGCAC GGGAACCTGG CAATGTTGCG AATGCTGCTC 
AGTCACGGAG CGCCGGTCAA TGTCTTCGAA ACGCAGCACG GCGGAAGCCC AATGGGATGG 
GCGCTACACG GCTCGGAGAA CAGTTGGCTG CGCGATAAGG GTGATTATCC CGGGGTAGTG 
CGCGCGCTGT TCGCTGCAGG AGCGACGCTT CCCCAGCCGC AAGGTCCGTG GGCAGCGACG 
GAAGAGGTTA TGGATGTTCT GCGCGAGCAT GAACTGAGCG AGGAGCCTCC GCAGACCTAG

Protein sequence

MSPRELPARP NLEHLKKQAR TLLQEAQSSE PSAMARFTEV SVASSAPKLA DALHVIAREY 
GFESWPKLKL HVESNSEDAG LALTAAIRAN DAKLVRSVLE RHPSLTKQIN EPLTHYSFDI 
PPIVAAAERE SREVVDVLLA AGANINERSR WWAGSFGVLD FCGSELAEYL ISRGATLDIH 
SAARLGKVDE VRAMLARDPQ LVHARGGDGQ LALHFAATVE IAELLLEHGA KVDVRDIDHE 
STAAQYMAGF GRYRNSPKSD RHDIVRLLIS KGAETDILMA SAIGDRTLVE EILNNDPDTV 
RVIVNEKHLP KRDLKSGGMI YFYGFGMTKT PHMIALDFGH RDVFELLMQR SAPWLRLSQA 
AEAEEESLVR ELVQKHPAMM AKLTPNAARR IVGPAVRGNT RAVELLLECG WPANATLDNN 
QTALHYAAWH GNLAMLRMLL SHGAPVNVFE TQHGGSPMGW ALHGSENSWL RDKGDYPGVV 
RALFAAGATL PQPQGPWAAT EEVMDVLREH ELSEEPPQT