Gene Meso_1001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Meso_1001
Symbol
ID	4181686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chelativorans sp. BNC1
Kingdom	Bacteria
Replicon accession	NC_008254
Strand	-
Start bp	1098249
End bp	1099877
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	62%
IMG OID	638066881
Product	twin-arginine translocation pathway signal
Protein accession	YP_673563
Protein GI	110633355
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.483502
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTACGC TCAATCGACG GCGAGCGCTC GGCTTGCTTG GTGCCACCGC GGGCAGCATC 
GCCCTGCCAC GTTTCGCGAT CGGCCAGACG GCTCGCCCGT CCGTCACCAT CGCGGTGCAA 
AAGATCACCA ACAACAACAC GCTCGACATT TGGTATGAGC AGTCCAATGT CGGCGAGCGT 
GTATTCTTCC CCAACCTCTG GGAAGGGTTG ATCCTGCGCG ATTGGATGGG CAACCAGGGC 
CCCGTTCCCG GGCTTGCCAC AGAATGGCGG CGCATCGACG ACAAGACGCT CGAGCTCACG 
CTGCGCCAGG GCGTGAAGTT CCACAATGGG GACGAATTGA CCGCCGAGGA TGTGGTGTTC 
AGTTTCTCGG CAGAGCGCGT CTTTGGCGAC ACGCAGCCCG CTGGCGGCAG AACCATCTTC 
GAGACCGATC ACAAACCAAC CACGGTCAAA GAGCTGCCCG CGAGCGTGCC GGGCATCGGC 
CGCCGTCTGT GGCCGGCTCT GGCCGGCGTC GAGGCGGTGG ACAAATACAC GGTGCGTTTC 
CACAATGCCA CGCCGGATGT GACGCTCGAA GGGCGCCTCT ATTCCCACGG CAGCCAGATC 
GCCAACCGTC GTGCCTGGGA TGAGGCTTCC TCCTACAACG ACTGGGCGCG CAAGCCCATC 
ACCACTGGCC CCTATATGGT CGGCGAATAC CGGCCCGACG TTTCGCTGAC GCTGGTTGCC 
TTCGACGACT ACTGGGGCGG GCGGCCGCCG CTGGAGCAGA TCCGCTTCGT CGAGGTGCCG 
GAAGTATCCT CGCGCGTGAA CGGCCTCTTG TCGGGCGAAT ATGATTTCGC CTGCGACCTG 
CCGCCGGATC AGATCGCCGC GGTGCAATCC GCTCCGGGTT TCGAGGTCCA GAACTCCACG 
ATCTGGAATC ACCGCATTTC CGTCTTCAAC ACGCAGATCC CGATACTGGC CGATCCGCTT 
GTGCGCCGCG CCATGACGCA TTCGATCGAC CGTCAGGCCA TCGTCGATTC GCTCTGGGGC 
GGCCAGACGG TCATCCCGGC CGGGCTGCAG TTCGAATCAT TCGGCGACAT GTTTGTACAG 
GGCTGGACTG TTCCGGAATT CAATCCTGAA CTGGCGCGCG ATCTGTTGCG GCAGGCGAAC 
TACAAGGGCG ACCCGATCCC TTATCGCCTG CTGAACAACT ATTATACGAA CCAGACACCC 
ACGGCGCAGA TCCTGGTCGA GATGTGGAAG CAGGTGGGCC TCAATGTCGA GATCGAGATG 
AAGGAGAACT GGGCTCAGAT CCATGAGCCG GCCGGGGTGA AGGGTGTACG CGACTGGTCG 
GCGTCCAACA CCATCAACGA CCCGATCACC CCGATGGTGG TGCAGTTCGG CCCCAATGGC 
GAGGTCCAGC AGAAGCAGGA CTGGACCAAC GCCGAGGTGA ACGAGCTTTC CGTCGTGATG 
GAAACCTCGA CCGACAAGGC AAAGCGCAAG CAGGCTTTCG CCCGCATGCT GGAAATCTGC 
GAGCGCGAGG ACCCCGCCTA TACGGTTCTG CACCAGAACG CCGTTTTCAC CGGCATGAAG 
TCTTCCCTGA AGTGGAAGGC GGCTCCCGCC TTCGCAATGG ACTTCCGCAG TTCCAACTGG 
ACGAGCTGA

Protein sequence

MFTLNRRRAL GLLGATAGSI ALPRFAIGQT ARPSVTIAVQ KITNNNTLDI WYEQSNVGER 
VFFPNLWEGL ILRDWMGNQG PVPGLATEWR RIDDKTLELT LRQGVKFHNG DELTAEDVVF 
SFSAERVFGD TQPAGGRTIF ETDHKPTTVK ELPASVPGIG RRLWPALAGV EAVDKYTVRF 
HNATPDVTLE GRLYSHGSQI ANRRAWDEAS SYNDWARKPI TTGPYMVGEY RPDVSLTLVA 
FDDYWGGRPP LEQIRFVEVP EVSSRVNGLL SGEYDFACDL PPDQIAAVQS APGFEVQNST 
IWNHRISVFN TQIPILADPL VRRAMTHSID RQAIVDSLWG GQTVIPAGLQ FESFGDMFVQ 
GWTVPEFNPE LARDLLRQAN YKGDPIPYRL LNNYYTNQTP TAQILVEMWK QVGLNVEIEM 
KENWAQIHEP AGVKGVRDWS ASNTINDPIT PMVVQFGPNG EVQQKQDWTN AEVNELSVVM 
ETSTDKAKRK QAFARMLEIC EREDPAYTVL HQNAVFTGMK SSLKWKAAPA FAMDFRSSNW 
TS