Gene Acid345_2573 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2573
Symbol
ID	4070536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3036332
End bp	3037867
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	56%
IMG OID	637984590
Product	Cna B-type protein
Protein accession	YP_591648
Protein GI	94969600
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATTGC ATCCGATTCT CCCCTTTCGA AAAGTTGTAC TTCTCGTCGT CGCAGCCCTT 
CTTCTCCCTA CGCTCGTGTT CGCGCAGGCT TACTTCGGTA CAGTAAGCGG AAGCATCGTC 
GATACCAGTG GGGCCGTCGT GCCCGGCGTC AATGTGACGC TGACTGACAT GCAAAAGGGC 
TTCACATTCC ATGCGCAATC GGGCAGCGAT GGACACTACC TCTTCCGCTC CATTCCCCCG 
GGGGTTTATC GGGTTTCAAC CGAGGCTACG GGCTTCGAGA AAGCGACCAG CACCAACGTC 
AAAGTTGATA TCAACGAGAA CGCCACAGCG AACCTGACTC TCAAGGTGGG CACGACCACC 
CAGACCGTGG ATGTTGCCGG GAATGCTCAG AAGATTGAGA CCGAGGACGC GGAAACCGGC 
CAGGTCATCA ATCGGAAATT CATCAACGAT CTGCCCCTCA TTAGCCGCTA CGTGATGGAC 
TTGACCTACT TAGCTCCCGG CGTGGCCGAC ATGGACGACC AATGCCCGAA CTGCGGTGGA 
ACGAATTTCG TTTCTAACGG GAGCCGTGGT GCTTCGGCCG ACATCTTGCT AGACGGTGCC 
TCCACCACGA ATTTCGAACC GAACGGTGGC GTGACGCAAG CAACGTACTC GCCGTCTCCG 
GAAGCGGTAG AAGAGTTCAA GGTCGAGCAA TCGAATTTCA GCGCGGAATA CGGATTCTCA 
GGAGCGAGCG TCATCAACAT GGTGACGCGC TCTGGGACCA ACAAGTTTCA CGGCAGCGTG 
TACGACTATC TGCGTAACCA GGTGCTGGAC GCCAACAACT GGTTCAGCAA TTACTACGGG 
GATCCCATAC CGGCGCTGAA GCGGAACAAC TATGGAGTCA CCATCGGCGG ACCGATCATT 
AAGAACAGGA CCTTCTTCTT TTTCGATTAC GACGGTTTCC GCGAATCATC CGCGAGTTCG 
GCAACGGCGG GTGTTCCCAC CGACGCCATG CGGGCCGGCG ATTTCGGCGA GGTATGCAGT 
GAAAAGGGCG GCAGCTTTGA CTCCCACGGC ATCTGCAGCG TTACGGCCGG ACAAATCTAC 
GATCCCTATC AAGGTGTGTA CGATCCCGGC AACGGTGGAA CCAACCGCAA TGTCGCCATT 
CCGTACAACA ACCTGGCCAC TTACGCGAGC CCGGGAAACG CGGCGTTGAT TGGCAGTCCG 
TATCAACTTC CGGTTCATCC CGGAAACCTG ATCGATCCGG TAGCGCAAAA GATGATGGGC 
CTCTTCCCGA AGCCGAATAT TTCGGGTGGA TCGATTTACC AGAACTGGTA TAGCTCAGGT 
GCTTCACAGG GATTCAACGA TCAACTCGAC TTCAAGATCG ACCACCGTGT CTCGGAGAAG 
AACCTTCTCA GCGGTAAGTA CTCGCACCAC TGGAACCACA ACGCTGGGTT CAACTGCTTC 
AAGAATTTCA TTGATCCTTG CCAGGGCGGC CCCAACGAGT CAAGCGCAAA CCTGTTCGCG 
ATCATGACAC CCATACGTTC AGCCCGACAT TCCTGA

Protein sequence

MALHPILPFR KVVLLVVAAL LLPTLVFAQA YFGTVSGSIV DTSGAVVPGV NVTLTDMQKG 
FTFHAQSGSD GHYLFRSIPP GVYRVSTEAT GFEKATSTNV KVDINENATA NLTLKVGTTT 
QTVDVAGNAQ KIETEDAETG QVINRKFIND LPLISRYVMD LTYLAPGVAD MDDQCPNCGG 
TNFVSNGSRG ASADILLDGA STTNFEPNGG VTQATYSPSP EAVEEFKVEQ SNFSAEYGFS 
GASVINMVTR SGTNKFHGSV YDYLRNQVLD ANNWFSNYYG DPIPALKRNN YGVTIGGPII 
KNRTFFFFDY DGFRESSASS ATAGVPTDAM RAGDFGEVCS EKGGSFDSHG ICSVTAGQIY 
DPYQGVYDPG NGGTNRNVAI PYNNLATYAS PGNAALIGSP YQLPVHPGNL IDPVAQKMMG 
LFPKPNISGG SIYQNWYSSG ASQGFNDQLD FKIDHRVSEK NLLSGKYSHH WNHNAGFNCF 
KNFIDPCQGG PNESSANLFA IMTPIRSARH S