Gene Cpin_4000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpin_4000
Symbol
ID	8360173
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chitinophaga pinensis DSM 2588
Kingdom	Bacteria
Replicon accession	NC_013132
Strand	+
Start bp	4976737
End bp	4978665
Gene Length	1929 bp
Protein Length	642 aa
Translation table	11
GC content	47%
IMG OID	644966174
Product	transglutaminase domain protein
Protein accession	YP_003123663
Protein GI	256423010
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000741085
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0455178
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTCGT TTTTAACCAA AAAATACGCA TCCGCAGTTT GTTACTGTGT ATGCGTATTA 
TTGTCCATAG GCCCGGCTTT TGCCGGAGAC CCGATTTATC CGGCCATGCT GATTCCAGAT 
TCTCTGAAGA AGAATGCACA CGCGGTAACG CGTCTGGAAG AGGTGACCGT AAAGGTCAAT 
GATCCCCGGG ATGTGCGTAT GACCATGCAC TATATTGTTA CGGTGCTGGA TGCGGAAGGG 
GAGAAGTTTG CCTATTTCGC CGGTGGCTAT GATAAATTGA CGGAAATCCG TTCTATTAAA 
GGCACCTTAT ACGACGGACT GGGATTACCC ATCAAAAAGC TTAAACAGAG CGATATACAG 
GATCTGAGCG GCACTGGCGG TGATCTGATG ACGGATGACC GTATTAAACG CCACGTCTTT 
TATCACAACC TGTATCCGCA CACCGTGGAG TATGAGGTGG AAATCAGGTA TAATCATAGC 
TATTACCTTC CAAAATGGCG TCCGCAGGAC GACGAATCCA TTGCGGTAGA GCAGAGTAAA 
CTGACCGTGA TTACGCCAAA GGACTATTTA CTCCGCTATA AGGCGCTCAA TTATAAAGGC 
GAACCCTTAT TGGGAAATGA CGGATCCGAC CGTACTTATA CCTGGGAGGC GAAGAACCTT 
TGTGCTGTTC CGGAAGAACC TTATGCGCCA CATTGGAGCA CCCGTTCTAT ATCGGTGCTG 
CTGGCTCCGG CGTCATTTGA AATGGCACAG TATAAGGGGA CGATGAATAC CTGGGAAGAA 
TTCGGGAAAT TCTCCTATAT ACTGAATCAG GGAAGAGACG TACTGCCGGA TAATATAAAG 
CAGACCGTAC ATCAGCTGAC GGATGGTCTA GCCCGCGAGC AAAAGATCTC GAAGCTCTAT 
GAATATCTGC AACAGCATAC CCGTTATATC AGTGTACAAT TGGGTATAGG CGGCTGGCAG 
ACTTTCGATG CTGCTTATGT GGCCTCCAAA GGGTATGGCG ACTGTAAGGC ACTTTCCAAT 
TATATGTGTG CAATGCTGAA GGAAGCGGGT GTTAAAGCCT CCTGTGTGCT GGTATATGCC 
GGGGAAGACA GGAATGATGT AACACTGGCA GATTTTCCTT CGCCCAGTTT CAATCACGTA 
ATCGTATGCG TACCCGATAC AAAAGATACG ACATGGCTGG AATGCACCAG CAGTACAGTG 
CCTCTGGGCT ATATGGGAGA ATTTACCGGT AACAGGTCTG TGCTGATCGT AGACGAAAAC 
GGGGGGAAAC TGGTACGTAC ACCTGTCTAT TCTATGGAGC AGAATGTACA GACACGTAAT 
ATCGTCGCTA AAGTGGAGGA ATCCGGCGAA ATGAGTGTCA GGGCTAATAG CCGTTATAGC 
GCATTACAGA CGGATGACCT GCATTCAGCA CTGAACAGCC TTACCAAAGA GAAACTGATG 
GAGGCGCTGA AACAAGTGGG CTTTTTCCCC AGTTACGAGG TGAAAAGTTA TGACTGGAAG 
GAAACTAAGT CTGTGTTGCC ATATATTGAC GAGCGGATCG AAATTACTGC CCGTAACTAT 
GCTACGATCA CGGGTAAACG CATGTTCATC GAGCCTAACC TGATGAACAA GACTTCAAAG 
CGATTATCTG TTGATTCCGT ACGCAGGGCA GACATCTACC TGAGTCATTC CTATCGTGAT 
ATCGATACCG TAAAGATCAC TATTCCGGAG GGTTATACAC CTGAAGCGAT GCCTCAGCCA 
ATGACCTTAG AGAGTCCTTT CGGGGTTTAT TCTTCAAAAG TGAGTATCGA AGGGAATGTG 
ATCACTTATA TCCGTTCTAT TGATCATAAA GGAGGTACTT ACCCTGCCAG TTCCTATGGG 
GAGCTGGCAA AGTTCTATAA TAGTATGTAT AAAGCAGACA GGAGCAGGAT CGTTCTCGTC 
AAAAAGTGA

Protein sequence

MFSFLTKKYA SAVCYCVCVL LSIGPAFAGD PIYPAMLIPD SLKKNAHAVT RLEEVTVKVN 
DPRDVRMTMH YIVTVLDAEG EKFAYFAGGY DKLTEIRSIK GTLYDGLGLP IKKLKQSDIQ 
DLSGTGGDLM TDDRIKRHVF YHNLYPHTVE YEVEIRYNHS YYLPKWRPQD DESIAVEQSK 
LTVITPKDYL LRYKALNYKG EPLLGNDGSD RTYTWEAKNL CAVPEEPYAP HWSTRSISVL 
LAPASFEMAQ YKGTMNTWEE FGKFSYILNQ GRDVLPDNIK QTVHQLTDGL AREQKISKLY 
EYLQQHTRYI SVQLGIGGWQ TFDAAYVASK GYGDCKALSN YMCAMLKEAG VKASCVLVYA 
GEDRNDVTLA DFPSPSFNHV IVCVPDTKDT TWLECTSSTV PLGYMGEFTG NRSVLIVDEN 
GGKLVRTPVY SMEQNVQTRN IVAKVEESGE MSVRANSRYS ALQTDDLHSA LNSLTKEKLM 
EALKQVGFFP SYEVKSYDWK ETKSVLPYID ERIEITARNY ATITGKRMFI EPNLMNKTSK 
RLSVDSVRRA DIYLSHSYRD IDTVKITIPE GYTPEAMPQP MTLESPFGVY SSKVSIEGNV 
ITYIRSIDHK GGTYPASSYG ELAKFYNSMY KADRSRIVLV KK