Gene Acid345_0824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0824
Symbol
ID	4072350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1023346
End bp	1025016
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	57%
IMG OID	637982833
Product	ASPIC/UnbV
Protein accession	YP_589903
Protein GI	94967855
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.853245
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTCTC CTCCTGGCGC AAAGTCGACA AAGTGCAACG GGCGGCCCAT CCCGCAGTTT 
GAAGACGTAA CTTCCAAGGC CGGGATCCGC TTCACCCATA CCTCCGATCC TTCCAAGAAG 
TACATCGTCG AGTCAATGAG CGGCGGCGTG ATTCTGATTG ATTACGATCG CGACGGTTGG 
CCGGACATCT ATTTCACCAA TGCCCCTACG GTTGATAAGG CCTTGAAAGG AGAGACGAGT 
CTCGGAGCTC TCTACCACAA CAATCACGAT GGCACCTTTA CCGACGTGAC CGCAAAATCT 
AGGCTGGATT CGCCCTGCTT CGCCATGGGC GGGGCCGTGG GTGACTACGA CAACGATGGC 
TGGCCCGATC TCTACCTGAC CTGCTTCGGT GGCAACGTCC TGTACCACAA CGACGGGAAC 
GGCACCTTCA CTGACGTAAC GAAGAAAGCC GGAGTGCGCG ATGGCCGATG GTCCACAGGC 
GCGTCCTTCG GAGACTACGA CGGCGACGGC AACGTGGACC TGATGGTGGT GAACTACGTC 
GATCTCCGTC TCAACGATCT TCCGCCCTTT GGAAAACTTC CGAACTGTAA ATATCGTGGC 
ATCGATGTCC AGTGCGGTCC CCGCGGGTTG AGGGGTGCGG GCGACTCTCT CTTCCACAAC 
AATGGTGACG GCACCTTTAC CGACGTTTCC AAGGCCGCCG GGGTCGACGA TGTCCCGGGA 
TATTTCGGAA TGGGCGTCGT CTGGGTTGAC TTCAACAATT CGGGGCGTCC AGACATCTAC 
GTCACGAACG ACTCCAGTCC GAAATATCTC TACAAGAATG AAGGCAACGG AAAGTTCAAA 
GAGATCGGCC TTGAGTCCGG TACCGCGGTC AACGAAGACG GCTCAGAGCA AGCTTCCATG 
GGCATCGCCG TCGGCGACTA CAACCACACC GGACGGCCCT CCCTCTACAT AACCAACTTC 
GAAGATGAAG ACGACCTTCT TTATCGTAAC GATGGCGATT GGAACTTCAC GGACGTCTCG 
TACAAGTCAG GCGTGGCGTT GCCTTCGCTG CGATCGGTGA AATGGGGAGA CGCCTTTGCG 
GATTTCGATA ATGACGGCTG GCTCGACATC TTCGCGGTCG GCGGTCATGT TTATCCGCAG 
GTGGACGGAC TTCCATCTGG CGGAGGATAT CGCCAACCGA AACTCTTCTA CTTGAACCAG 
AAAGATGGAT CCTTCTGCGA CGCCGCCGAC AAGGCCGGTC CAGCCCTAGC CGAGAAGCGC 
GTCTCGCGGG GCGTAGCTGT CGGCGATCTA TTCAACGACG GCAACCTCGA TATCGTGGTT 
GAAGACCTCG ACGGCAGCCC GACGATCCTG CGCAACAAAG GCGTCCCCGG AAACCATTGG 
GTGAGTTTTG AGTTGGCGGG TACCAAGAGC AATCGCCTGG CACTCAACGC CAAGGTGAAG 
ATCACAGCGG GCGGAGTTAC CCAGACCGAT GAAATTCATA GCGGCGGCAG CTATCTGTCG 
CAGAACGATC TCCGGGTGCA TTTCGGACTC GGAACCGCAA CGAAAATCGA CTCCGTCGAG 
GTCCGCTGGC CATCGGGCAA AGTGGACACC GTGAAGGACA TCCAAGCCGA TCACTACTAC 
GCCATCCTGG AGGGAAAGGG AATCGTTTCC GGTCTCTCCC GGAGTCACTA G

Protein sequence

MPSPPGAKST KCNGRPIPQF EDVTSKAGIR FTHTSDPSKK YIVESMSGGV ILIDYDRDGW 
PDIYFTNAPT VDKALKGETS LGALYHNNHD GTFTDVTAKS RLDSPCFAMG GAVGDYDNDG 
WPDLYLTCFG GNVLYHNDGN GTFTDVTKKA GVRDGRWSTG ASFGDYDGDG NVDLMVVNYV 
DLRLNDLPPF GKLPNCKYRG IDVQCGPRGL RGAGDSLFHN NGDGTFTDVS KAAGVDDVPG 
YFGMGVVWVD FNNSGRPDIY VTNDSSPKYL YKNEGNGKFK EIGLESGTAV NEDGSEQASM 
GIAVGDYNHT GRPSLYITNF EDEDDLLYRN DGDWNFTDVS YKSGVALPSL RSVKWGDAFA 
DFDNDGWLDI FAVGGHVYPQ VDGLPSGGGY RQPKLFYLNQ KDGSFCDAAD KAGPALAEKR 
VSRGVAVGDL FNDGNLDIVV EDLDGSPTIL RNKGVPGNHW VSFELAGTKS NRLALNAKVK 
ITAGGVTQTD EIHSGGSYLS QNDLRVHFGL GTATKIDSVE VRWPSGKVDT VKDIQADHYY 
AILEGKGIVS GLSRSH