Gene Acid345_3655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3655
Symbol
ID	4072258
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4324550
End bp	4326070
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	60%
IMG OID	637985678
Product	TPR repeat-containing protein
Protein accession	YP_592730
Protein GI	94970682
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.822576
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCGCG CGGCTCCGCT GCTGCTCAGC TTGCTTCTGA TGTCGGGAAC GCAGTCGTTT 
TATGCTGCCC AGGAAACGCA CGACCATCCG GTGCCGGAAG TTCTCGGGAG CGTGACTTTT 
CCGATCTCGT GCACAGCCGA AGTGCAAGGC GACTTCAACC GTAGCGTCGC TCTGCTGCAC 
TCGTTTGCGT ATGCCGCGGC GTTGAACGCG TTCCAGGCAG TGGCTGAGCG TGATCCGAAA 
TGCGCAATGG CGTATTGGGG CGTCGCCATG TCGGGCTATC ACCAGTTGTG GGAGCCTGCG 
ATTTCGGCCG ATGGGGCTGC ACGGGCGCAG CGCGAGCTTT CACTGGCGAT GAGCGCAGGC 
GCTGTAACAG ATCGCGAACG CGGGTTTCTG AACGCGGCAA ATGCGATCTT CAAGGATGCC 
GATACGGTTC CGATTGCGAC TCGTGCCGGA GCTTACGAGA AGGCGATGGC GGAACTTGCA 
GCGCGTTATC CGGCCGACGT CGAGGTGCAA ACGTTTTATG CGCTTGCTCT CCTGGCGAAT 
GCATCGCCCT CCGACAAAAC GCACGCGCGC CAGAAGCACG CGGCGGACAT CCTGGAGGCG 
CTCTTCAAGA AATACCCACA GCATCCGGCG ATTCCGCATT ACCTGATCCA CGCCTACGAC 
AACGCGGAAC TCGCGGAGCG AGGACTTCCC GCGGCTCGCG CCTATGCGCA GGTTGCGCCA 
TCTGCGCCGC ATGCTTTGCA TATGCCGAGC CACATTTTCA CGCGACTCGG GCTGTGGGAA 
GACTCGATCG CGTCGAACAC GGCGGCGCGT ACTGCGGCAC ACCGAGCGGG TGATATCGGA 
GAAGAACTGC ACGCAATGGA TTACCTCGTG TATGCGCAAC TGCAGCTTGG TCGCGATGAA 
GATGCCGCGC AAATCGTCGG CGAGTTGAAG AAGATGGAGA GCCTGCACAC TGCCGATTTC 
AAAGTCGGTT ATGCTGCGAC CGTGATGCCG ATTCGCTACG CTCTGGAGCG CGGAAAATGG 
GCAGAGGCGG TTCAACTGCC GGTTCCCGAG TCGGCTCCGC CGCATGTGCG TGCAATTGCG 
ATCTGGGCGC AATCGATTGG GAACGCGCAC ATGGAGAAGG CGAAGGAAGC ATCGGGTGCA 
GTCGCACAGC TTCAGCAGAT CGAGGACGAC TTGCAAGGGA AGGGCAACGG GTACTGGGCA 
ACGCAGGTGC GCGTCCTCAA GCGCGAGGCG ATGGCGTGGG TAGCGTTCGC CAACCATGAC 
TTGGACAAAG CTACTTCAAC GATGCGTCAG GCTGCGGATG AGGAAGATGC GGTGGAGAAG 
TTGCCGGTGA CTCCGGGGCC CGTGATTCCT GCACGCGAAC AACTCGGGGA ACTTCTGCTC 
GAGCAAGGCA AACCGGCGTT GGCGGTAGAA GAATTCAACA TCGATCTGCG CAATTCGCCG 
AATCGGCGAC GCGGAAGGTT TGGTTTGAAT GAAGCGACGA AGAAGGTAGA GTCGAACCAT 
CGTGATGATC GCGCGCTATA A

Protein sequence

MSRAAPLLLS LLLMSGTQSF YAAQETHDHP VPEVLGSVTF PISCTAEVQG DFNRSVALLH 
SFAYAAALNA FQAVAERDPK CAMAYWGVAM SGYHQLWEPA ISADGAARAQ RELSLAMSAG 
AVTDRERGFL NAANAIFKDA DTVPIATRAG AYEKAMAELA ARYPADVEVQ TFYALALLAN 
ASPSDKTHAR QKHAADILEA LFKKYPQHPA IPHYLIHAYD NAELAERGLP AARAYAQVAP 
SAPHALHMPS HIFTRLGLWE DSIASNTAAR TAAHRAGDIG EELHAMDYLV YAQLQLGRDE 
DAAQIVGELK KMESLHTADF KVGYAATVMP IRYALERGKW AEAVQLPVPE SAPPHVRAIA 
IWAQSIGNAH MEKAKEASGA VAQLQQIEDD LQGKGNGYWA TQVRVLKREA MAWVAFANHD 
LDKATSTMRQ AADEEDAVEK LPVTPGPVIP AREQLGELLL EQGKPALAVE EFNIDLRNSP 
NRRRGRFGLN EATKKVESNH RDDRAL