Gene Acid345_3797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3797
Symbol
ID	4071081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4486736
End bp	4488151
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	52%
IMG OID	637985820
Product	hypothetical protein
Protein accession	YP_592871
Protein GI	94970823
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.533548
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCGAAGA ATGTTTTGAT ATTCCTGCAA GTGACCGTAC TCGGATTCGC ATCCGCGGCT 
TTCGCCGCGA ATGCCTCAAG TGTCGTTCGC CTGAAACCTG ATCAGGATTT CGCGTCCATC 
ATCAAGAATG CCCCGGCTGG CTCGCAGTTT GAGTTCGCGG CGGGTGACTA TCGCATGGCT 
TCGATCACCC CGAAAACTGG CGATTCGTTT CGTGGAAACG GGCAGGCTGT TCTGAATGGG 
GCGAAGCTGG TCACGTTTAG GCAGGACGGG AAACTTTGGA GCATCAGTGA GCAGTTGGGT 
CGCTCGAGAA ACGGATCCTG CGAGCCGTCG CGCCCAGCAT GCCTGATCTT GAACGATCTC 
TTTATTGACG ACAAACTGCA GACCCTGGTG CTTGATAGAT CTCAACTAAC GGTTGGAACC 
TGGTACTACG ACCAGGCGTC TTTGAAAGCG TACATCAGTG TGGATCCGAC CGGCCATAAA 
GTAGAGTTAG GATCCGCGCC GCTTGCTTTT GCGGGATCGG CGACCGATGT GACGATTGAC 
GGCTTTACTG TCGAAAAATA TGCTAATTCG CCACAGACTG GGGCGGTCGG TGGGTATAAC 
GGCAGCGCAC ACTCGTGGAT AATTCGTCAC GTTGAGACGC GTTGGAATCA CGGTGTAGGC 
ATTGCAGTGG GCAGTAACAG CATAATTCAG TCAAGTAATT CTCATCATAA TGGCCAACTC 
GGAATGGCTG CACACGGCGA GAATATCCAG ATTTTGGATA ATACGATCTC GAACAACAAC 
TATGCGGGTT TCAAAATCGT TTGGGAGGCG GGTGGAACCA AATTCTCTGG CTCTGACCAC 
CTTTTGGTTC GTGGGAATGT TGTTGAAGCG AACTACGGTA ACGGGCTTTG GACCGACATC 
GATAACATCC ACGTAGTCTA CGAAAAAAAC AGAGTTCTCA ACAATACGGG CGCCGGAATT 
GTGCATGAAA TTAGCTATGA TGCTGTGATC CGCAACAATT TCGTGTCCGG CAATCGAGTC 
GGAATCATCA TCATTCTTTC TTCGAATGTA CAAGCTTATG GCAACGTCGT TGAGGTGCCT 
CCGAACGGTA CGGACGCCAT ACGAGTTGCG AATGGCAACC GCGGCGAAGG GAAATTTGGT 
CCATATGTCG CCCACGATAT TCGGGTGTAT GACAACATCA TTACGTTCCT GGGATCGAGT 
GGGCGCAGCG GACTTAGTGG GCCATTGGAT ACGGCGAGAA ACGTCGTTTT CGAAAATAAC 
CAATATCACC TGCTCGGTGG TGGAAACGCT CACTGGATAT GGGGATCTCC CAATCCAGTG 
CCATTGAGTG AAGTGCAACG TGTCGGCTCG GACAAAGGGG CAAAGGTCTC ACGAGAACCT 
GCGAAGATGA TCGATCCAAC GCGATCCCCA GAGTAG

Protein sequence

MAKNVLIFLQ VTVLGFASAA FAANASSVVR LKPDQDFASI IKNAPAGSQF EFAAGDYRMA 
SITPKTGDSF RGNGQAVLNG AKLVTFRQDG KLWSISEQLG RSRNGSCEPS RPACLILNDL 
FIDDKLQTLV LDRSQLTVGT WYYDQASLKA YISVDPTGHK VELGSAPLAF AGSATDVTID 
GFTVEKYANS PQTGAVGGYN GSAHSWIIRH VETRWNHGVG IAVGSNSIIQ SSNSHHNGQL 
GMAAHGENIQ ILDNTISNNN YAGFKIVWEA GGTKFSGSDH LLVRGNVVEA NYGNGLWTDI 
DNIHVVYEKN RVLNNTGAGI VHEISYDAVI RNNFVSGNRV GIIIILSSNV QAYGNVVEVP 
PNGTDAIRVA NGNRGEGKFG PYVAHDIRVY DNIITFLGSS GRSGLSGPLD TARNVVFENN 
QYHLLGGGNA HWIWGSPNPV PLSEVQRVGS DKGAKVSREP AKMIDPTRSP E