Gene Paes_1301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1301
Symbol
ID	6460540
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	1420324
End bp	1422228
Gene Length	1905 bp
Protein Length	634 aa
Translation table	11
GC content	52%
IMG OID	642725288
Product	TonB-dependent receptor
Protein accession	YP_002015973
Protein GI	194334113
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4206] Outer membrane cobalamin receptor protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAAA AAATTATCGC TCTTCTCATC GCGAGTGTGT GTTGTCACTG CACGCTTTAT 
GCTGACGATT CATCTCAATC GGCAATTCTT TCGTCCTACA CCGGTGACGA GCTTGTGGTG 
ACCGCGACAC GCTTTCCCAT CAAGGAAAAG GAGAGTTCTC GCTTCATTAC TGTCGCTGAC 
AGCGAAAAGC TCAAGGAAGT CGGTGCGACA AACGCCATGG ATGCCCTCGG AAAAATCGGA 
GGGATCGGCT ACAAGTCTCT CGCCCCGATG GGGATCAACA GGCAGGGAAT GAATGCCGCA 
GTCTACATCA GGGGGATCGA GGACGGGGAG CTGATCCTGA TCAACGGAAT GCCTGTCCAG 
CAGGCTTCGG GCAAAGGATA TGACATCAGT TCCATTCCTG TCGAGCAGAT CGAGCGGATC 
GAGGTACTCA AAGGCGCAGC ATCGACCCTT TACGGGGCGG ATGCGATGGC CGGCGTGATC 
AATATCGTGA TGAAAAAGGC CGTCGATGAA AAAAGCGGAA CCGCATCTGT TGAGTTCGGA 
AACGAAGAGT GGATGAATCA CGGTGTCAGT TTCTCTCTTC CCGGCATTTC CGCCGGTGTT 
CGTTACCAGC ATATGGGCGA ACTGGATGAT GTTGGCAGGG ATCTGAAAAA CGAGCACACG 
ATGGCGCTCG GCAACACTGA CAAGTATATG GTCAATGTCA ACGCATCACC CTTCGACAAC 
GTCTCTGTCG ACTACCAGTA TAACTGGTAC GAAACGACTT TCATCGACCG GTACGATTCA 
GGCGAAGAGG AGTCGACCGA TCAGGAAAGC AGTTTCCACT TCCTGAGCCT TCGCTATGAG 
ACTGCAAGGT TCAAGGCCAA GGCGTTCGGT GTTTACGACA ACCGGTACCA GACGGACTAT 
GTCAATGAAG AACAGGATGG AGAGACCTTG CAGAGGCTGA ATTATAACTA TGGGGCGGAA 
ACGGATTATC GCTTCAAGTT CTCTGAGGCT TTCGAGCTGG TCGCCGGAGC CGATTATGTG 
CATCGTTTTG CTGATTACGA GAACAATTAC GGTGAGAAAT ACCGTGACGA TTACGGGCTT 
TTTGCCGAGC TCAAAGCAGA GCCGTCATCT GATTTGCTTC TTGCCCTTGG CGTTCGTGAG 
CAGTTCATCG ATAACGAGGA CGGTACGTCG GACTACGATG CATTTCTTCC CAGCGCAGGT 
GTGACATGGA AAGTCAATGA AGAGCTGAAC CTCTTTGCCA ATACAGGCAA GGCGTTCCAG 
GCTCCGACCT TTACCCAGCT GTATTACGAG GGCAGGATCA TTGTTGGCAA CCCTGATCTC 
GAGCCGGAGT CCGGCTGGAC CTATGAAGCT GGATTCAAGT ACGATTCCGG GGTGGCATCT 
GCAAGGCTGG CCGGTTTTTA CATGACCTAT GATGACAAGA TCGAAGTCGA CCGTTCACAG 
GGGCGTCCAT ACGGTTATTT CAATGCAGGA TCATACAGTT CCAAAGGGGT CGAGTGGAAA 
CTCGGGCTGT ATCCTTTCCT CTCTTCCGGC AGCTTTCTTT CCGATGTTTC CTTCTCGGCT 
GCCGGTTACT GGGCGTACCC GGTTGCCGAG AACACTGACG GAGAGGAGTA TCAGCCCGGT 
CCGAAGTTCC AGAACACGTT CGGAATCTCC TATGCGACCC TGCCGGTCAA TGTCGACCTT 
ACCTGCCGCA TTCTTGCCGG CCGCGAGGAC GAGCTTGAAA ATTATGCGGC TTTTGATATG 
ACAGGAAAGG TGAAGGCCGG TTCAGGTTAC GTGACGCTTG CTGTGGAGAA TGTCTTCGAT 
ACCGAGATAC AGACGACCGG AAATCTTGTT GAAGATGCCA GCAGCCGCTA CGTGTATTAC 
GAGCCCGGGC GACTTGCCAG GCTTGGTTAT ACGGTGTCTT TTTGA

Protein sequence

MQKKIIALLI ASVCCHCTLY ADDSSQSAIL SSYTGDELVV TATRFPIKEK ESSRFITVAD 
SEKLKEVGAT NAMDALGKIG GIGYKSLAPM GINRQGMNAA VYIRGIEDGE LILINGMPVQ 
QASGKGYDIS SIPVEQIERI EVLKGAASTL YGADAMAGVI NIVMKKAVDE KSGTASVEFG 
NEEWMNHGVS FSLPGISAGV RYQHMGELDD VGRDLKNEHT MALGNTDKYM VNVNASPFDN 
VSVDYQYNWY ETTFIDRYDS GEEESTDQES SFHFLSLRYE TARFKAKAFG VYDNRYQTDY 
VNEEQDGETL QRLNYNYGAE TDYRFKFSEA FELVAGADYV HRFADYENNY GEKYRDDYGL 
FAELKAEPSS DLLLALGVRE QFIDNEDGTS DYDAFLPSAG VTWKVNEELN LFANTGKAFQ 
APTFTQLYYE GRIIVGNPDL EPESGWTYEA GFKYDSGVAS ARLAGFYMTY DDKIEVDRSQ 
GRPYGYFNAG SYSSKGVEWK LGLYPFLSSG SFLSDVSFSA AGYWAYPVAE NTDGEEYQPG 
PKFQNTFGIS YATLPVNVDL TCRILAGRED ELENYAAFDM TGKVKAGSGY VTLAVENVFD 
TEIQTTGNLV EDASSRYVYY EPGRLARLGY TVSF